Nous utilisons des ensembles de données tabulaires provenant à l'origine d'OpenML et compilés en un ensemble de jeux de données de référence par l'équipe Inria-Soda sur HuggingFace. Nous effectuons l'entraînement sur 28 855 échantillons d'apprentissage et testons sur les 9 619 échantillons restants. Tous les MLP sont entraînés avec une taille de lot de 64, 64, et 0,0005, et nous étudions 3 couches de 100 neurones chacune. Nous définissons ici les six principales métriques utilisées dans notre travail.Nous utilisons des ensembles de données tabulaires provenant à l'origine d'OpenML et compilés en un ensemble de jeux de données de référence par l'équipe Inria-Soda sur HuggingFace. Nous effectuons l'entraînement sur 28 855 échantillons d'apprentissage et testons sur les 9 619 échantillons restants. Tous les MLP sont entraînés avec une taille de lot de 64, 64, et 0,0005, et nous étudions 3 couches de 100 neurones chacune. Nous définissons ici les six principales métriques utilisées dans notre travail.

Le Guide du Geek pour l'Expérimentation en ML

2025/09/21 13:47

Abstrait et 1. Introduction

1.1 Explication Post Hoc

1.2 Le problème de désaccord

1.3 Encourager le consensus d'explication

  1. Travaux connexes

  2. Pear : Régularisateur d'accord d'explicateur Post HOC

  3. L'efficacité de la formation au consensus

    4.1 Métriques d'accord

    4.2 Amélioration des métriques de consensus

    [4.3 Cohérence à quel prix ?]()

    4.4 Les explications sont-elles toujours précieuses ?

    4.5 Consensus et linéarité

    4.6 Deux termes de perte

  4. Discussion

    5.1 Travaux futurs

    5.2 Conclusion, remerciements et références

Annexe

A ANNEXE

A.1 Jeux de données

Dans nos expériences, nous utilisons des jeux de données tabulaires provenant à l'origine d'OpenML et compilés en un ensemble de jeux de données de référence par l'équipe Inria-Soda sur HuggingFace [11]. Nous fournissons quelques détails sur chaque jeu de données :

\ Bank Marketing Il s'agit d'un jeu de données de classification binaire avec six caractéristiques d'entrée et est approximativement équilibré en termes de classes. Nous entraînons sur 7 933 échantillons d'entraînement et testons sur les 2 645 échantillons restants.

\ California Housing Il s'agit d'un jeu de données de classification binaire avec sept caractéristiques d'entrée et est approximativement équilibré en termes de classes. Nous entraînons sur 15 475 échantillons d'entraînement et testons sur les 5 159 échantillons restants.

\ Electricity Il s'agit d'un jeu de données de classification binaire avec sept caractéristiques d'entrée et est approximativement équilibré en termes de classes. Nous entraînons sur 28 855 échantillons d'entraînement et testons sur les 9 619 échantillons restants.

A.2 Hyperparamètres

Beaucoup de nos hyperparamètres sont constants dans toutes nos expériences. Par exemple, tous les MLP sont entraînés avec une taille de lot de 64 et un taux d'apprentissage initial de 0,0005. De plus, tous les MLP que nous étudions comportent 3 couches cachées de 100 neurones chacune. Nous utilisons toujours l'optimiseur AdamW [19]. Le nombre d'époques varie selon les cas. Pour les trois jeux de données, nous entraînons pendant 30 époques lorsque 𝜆 ∈ {0,0, 0,25} et 50 époques dans les autres cas. Lors de l'entraînement des modèles linéaires, nous utilisons 10 époques et un taux d'apprentissage initial de 0,1.

A.3 Métriques de désaccord

Nous définissons ici chacune des six métriques d'accord utilisées dans notre travail.

\ Les quatre premières métriques dépendent des k caractéristiques les plus importantes dans chaque explication. Soit 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) représentant les k caractéristiques les plus importantes dans une explication 𝐸, soit 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) le rang d'importance de la caractéristique 𝑠 dans l'explication 𝐸, et soit 𝑠𝑖𝑔𝑛(𝐸, 𝑠) le signe (positif, négatif ou zéro) du score d'importance de la caractéristique 𝑠 dans l'explication 𝐸.

\

\ Les deux métriques d'accord suivantes dépendent de toutes les caractéristiques au sein de chaque explication, pas seulement des k premières. Soit 𝑅 une fonction qui calcule le classement des caractéristiques dans une explication par importance.

\

\ (Remarque : Krishna et al. [15] précisent dans leur article que 𝐹 doit être un ensemble de caractéristiques spécifié par un utilisateur final, mais dans nos expériences, nous utilisons toutes les caractéristiques avec cette métrique).

A.4 Résultats de l'expérience sur les caractéristiques inutiles

Lorsque nous ajoutons des caractéristiques aléatoires pour l'expérience de la section 4.4, nous doublons le nombre de caractéristiques. Nous faisons cela pour vérifier si notre perte de consensus nuit à la qualité de l'explication en plaçant des caractéristiques non pertinentes dans le top-K plus souvent que les modèles entraînés naturellement. Dans le tableau 1, nous rapportons le pourcentage de fois où chaque explicateur a inclus l'une des caractéristiques aléatoires dans les 5 caractéristiques les plus importantes. Nous observons que dans l'ensemble, nous ne constatons pas d'augmentation systématique de ces pourcentages entre 𝜆 = 0,0 (un MLP de référence sans notre perte de consensus) et 𝜆 = 0,5 (un MLP entraîné avec notre perte de consensus)

\ Tableau 1 : Fréquence des caractéristiques inutiles obtenant des rangs dans le top 5, mesurée en pourcentage.

A.5 Plus de matrices de désaccord

Figure 9 : Matrices de désaccord pour toutes les métriques considérées dans cet article sur les données de Bank Marketing.

\ Figure 10 : Matrices de désaccord pour toutes les métriques considérées dans cet article sur les données de California Housing.

\ Figure 11 : Matrices de désaccord pour toutes les métriques considérées dans cet article sur les données d'Electricity.

A.6 Résultats étendus

Tableau 2 : Précision moyenne des tests pour les modèles que nous avons entraînés. Ce tableau est organisé par jeu de données, modèle, hyperparamètres dans la perte et coefficient de décroissance des poids (WD). Les moyennes sont calculées sur plusieurs essais et nous rapportons les moyennes ± une erreur standard.

A.7 Graphiques supplémentaires

Figure 12 : Les surfaces logit pour les MLP, chacun entraîné avec une valeur lambda différente, sur 10 plans à trois points construits aléatoirement à partir du jeu de données Bank Marketing.

\ Figure 13 : Les surfaces logit pour les MLP, chacun entraîné avec une valeur lambda différente, sur 10 plans à trois points construits aléatoirement à partir du jeu de données California Housing.

\ Figure 14 : Les surfaces logit pour les MLP, chacun entraîné avec une valeur lambda différente, sur 10 plans à trois points construits aléatoirement à partir du jeu de données Electricity.

\ Figure 15 : Graphiques supplémentaires de courbes de compromis pour tous les jeux de données et métriques.

\

:::info Auteurs :

(1) Avi Schwarzschild, Université du Maryland, College Park, Maryland, USA et travail réalisé en travaillant chez Arthur (avi1umd.edu) ;

(2) Max Cembalest, Arthur, New York City, New York, USA ;

(3) Karthik Rao, Arthur, New York City, New York, USA ;

(4) Keegan Hines, Arthur, New York City, New York, USA ;

(5) John Dickerson†, Arthur, New York City, New York, USA ([email protected]).

:::


:::info Cet article est disponible sur arxiv sous licence CC BY 4.0 DEED.

:::

\

Opportunité de marché
Logo de SIX
Cours SIX(SIX)
$0.01325
$0.01325$0.01325
-0.67%
USD
Graphique du prix de SIX (SIX) en temps réel
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter [email protected] pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Vous aimerez peut-être aussi

Metaplanet forme des filiales axées sur le Bitcoin au Japon et aux États-Unis.

Metaplanet forme des filiales axées sur le Bitcoin au Japon et aux États-Unis.

L'article Metaplanet forme des filiales axées sur le Bitcoin au Japon et aux États-Unis est apparu sur BitcoinEthereumNews.com. Metaplanet (3350), la plus grande entreprise de trésorerie Bitcoin au Japon, a déclaré avoir établi deux filiales — une au Japon et une aux États-Unis — et acheté le nom de domaine bitcoin.jp pour renforcer son engagement envers la plus grande cryptomonnaie. Bitcoin Japan Inc. sera basée à Tokyo et gérera un ensemble de médias, conférences et plateformes en ligne liés au Bitcoin, y compris le domaine internet et Bitcoin Magazine Japan. L'unité américaine, Metaplanet Income Corp., sera basée à Miami et se concentrera sur la génération de revenus à partir de produits financiers liés au Bitcoin, y compris les dérivés, a déclaré l'entreprise dans une publication sur X. Metaplanet a noté qu'elle a lancé une activité de génération de revenus Bitcoin au dernier trimestre de 2024 et vise à développer davantage ces opérations par le biais de la nouvelle filiale. Les deux filiales entièrement détenues sont dirigées en partie par le PDG de Metaplanet, Simon Gerovich. Plus tôt ce mois-ci, l'entreprise a porté ses avoirs en Bitcoin à plus de 20 000 BTC. Elle est actuellement la sixième plus grande entreprise de trésorerie Bitcoin au monde, avec 20 136 BTC dans son bilan, selon les données de BitcoinTreasuries. La société leader, Strategy (MSTR), possède 638 985 BTC. Les filiales sont établies peu après que l'entreprise a annoncé des plans pour lever 204,1 milliards de yens nets (1,4 milliard de dollars) dans une vente d'actions internationale pour renforcer ses avoirs en BTC. L'action Metaplanet a chuté de 1,16 % mercredi. Source : https://www.coindesk.com/business/2025/09/17/metaplanet-sets-up-u-s-japan-subsidiaries-buys-bitcoin-jp-domain-name
Partager
BitcoinEthereumNews2025/09/18 06:12
Briser le silence : David Hermann sur le décodage de la résistance et la conduite du changement

Briser le silence : David Hermann sur le décodage de la résistance et la conduite du changement

La plupart des dirigeants d'entreprise pensent qu'ils résolvent des problèmes de stratégie, des inefficacités de processus ou des lacunes d'exécution. Mais selon David Hermann, PDG et auteur du
Partager
Techbullion2025/12/16 04:37
Le Bitcoin chute sous les 87 000 $ après que Strategy achète 10 645 BTC

Le Bitcoin chute sous les 87 000 $ après que Strategy achète 10 645 BTC

L'article "Bitcoin chute en dessous de 87 000 $ après que Strategy achète 10 645 BTC" est apparu sur BitcoinEthereumNews.com. Points clés Le 15 décembre, Bitcoin a chuté de 2,71%, baissant
Partager
BitcoinEthereumNews2025/12/16 04:02