Towards a generalized uniform language for explainability
Loading...
Date
2024
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Explainability, razonamiento sobre decisiones en Aprendizaje de Máquinas, es una área que ha crecido con gran interés. Construímos sobre efuerzos como los de Barceló et al. (2020), quienes definieron una estructura que permite comparar la interpretabilidad entre modelos de Aprendizaje de Máquinas. Ellos modelaron las explicaciones como problemas de decisión y estudiaron la complejidad de decidirlas en distintas clases. Y Arenas et al. (2024), quienes propusieron un lenguaje declarativo basado en lógica de primer orden lo suficientemente expresivo para capturar varias nociones de explicabilidad. Capturamos la complejidad de decidir importantes conceptos de explicabilidad sobre decision trees y free binary decision diagrams. Nuestra contribución fueron las nuevas cotas para las consultas DFS y MINIMALDFS que permitieron diseñar EXPLAINER, una lógica generalizada de interpretabilidad con predicados cuya interpretación es independiente de la clase de modelos y una nueva cuantificación sobre las features del modelo. EXPLAINER puede expresar consultas de explicabilidad mientras que su evaluación se puede decidir en la Jerarquía Booleana en las clases citadas. Esto proviene del uso de predicados basados en pruebas polinomiales de satisfacibilidad y tautología. En consecuencia, extendimos nuestros resultados a una larga lista de clases con dichas pruebas. Respecto a la computación de explicaciones, mostramos que la existencia de un algoritmo eficiente equipado con un oráculo NP implica el colapso de la Jerarquía Polinomial. Creamos una extensión sobre la implementación original para soportar la evaluación de EXPLAINER; la principal adaptación fue el nuevo tipo de cuantificación. Nuestros resultados experimentales muestran que los beneficios teóricos se transfieren a nuestra extensión en términos de clases soportadas, expresividad y rendimiento. Creemos estar en un buen camino para encontrar un lenguage general y uniforme para explicabilidad.
Description
Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2024
Keywords
Explicabilidad, Interpretabilidad, Aprendizaje de máquinas, Lógica