Wir verwenden tabellarische Datensätze, die ursprünglich von OpenML stammen und zu einer Reihe von Benchmark-Datensätzen vom Inria-Soda-Team auf HuggingFace zusammengestellt wurden. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben. Alle MLPs werden mit einer Batch-Größe von 64, 64 und 0,0005 trainiert, und wir untersuchen 3 Schichten mit jeweils 100 Neuronen. Wir definieren hier die sechs wichtigsten Metriken, die in unserer Arbeit verwendet werden.Wir verwenden tabellarische Datensätze, die ursprünglich von OpenML stammen und zu einer Reihe von Benchmark-Datensätzen vom Inria-Soda-Team auf HuggingFace zusammengestellt wurden. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben. Alle MLPs werden mit einer Batch-Größe von 64, 64 und 0,0005 trainiert, und wir untersuchen 3 Schichten mit jeweils 100 Neuronen. Wir definieren hier die sechs wichtigsten Metriken, die in unserer Arbeit verwendet werden.

Der Geek-Leitfaden zum ML-Experimentieren

2025/09/21 13:47

Abstrakt und 1. Einleitung

1.1 Post-Hoc-Erklärung

1.2 Das Uneinigkeitsproblem

1.3 Förderung des Erklärungskonsenses

  1. Verwandte Arbeiten

  2. Pear: Post-HOC-Explainer-Agreement-Regularizer

  3. Die Wirksamkeit des Konsens-Trainings

    4.1 Übereinstimmungsmetriken

    4.2 Verbesserung der Konsensmetriken

    [4.3 Konsistenz zu welchem Preis?]()

    4.4 Sind die Erklärungen noch wertvoll?

    4.5 Konsens und Linearität

    4.6 Zwei Verlustterme

  4. Diskussion

    5.1 Zukünftige Arbeit

    5.2 Fazit, Danksagungen und Referenzen

Anhang

A ANHANG

A.1 Datensätze

In unseren Experimenten verwenden wir tabellarische Datensätze, die ursprünglich von OpenML stammen und vom Inria-Soda-Team auf HuggingFace [11] zu einem Satz von Benchmark-Datensätzen zusammengestellt wurden. Wir geben einige Details zu jedem Datensatz an:

\ Bank Marketing Dies ist ein binärer Klassifikationsdatensatz mit sechs Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 7.933 Trainingsproben und testen mit den verbleibenden 2.645 Proben.

\ California Housing Dies ist ein binärer Klassifikationsdatensatz mit sieben Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 15.475 Trainingsproben und testen mit den verbleibenden 5.159 Proben.

\ Electricity Dies ist ein binärer Klassifikationsdatensatz mit sieben Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben.

A.2 Hyperparameter

Viele unserer Hyperparameter sind über alle unsere Experimente hinweg konstant. Zum Beispiel werden alle MLPs mit einer Batch-Größe von 64 und einer anfänglichen Lernrate von 0,0005 trainiert. Außerdem haben alle von uns untersuchten MLPs 3 versteckte Schichten mit jeweils 100 Neuronen. Wir verwenden immer den AdamW-Optimierer [19]. Die Anzahl der Epochen variiert von Fall zu Fall. Für alle drei Datensätze trainieren wir 30 Epochen, wenn 𝜆 ∈ {0,0, 0,25} und sonst 50 Epochen. Beim Training linearer Modelle verwenden wir 10 Epochen und eine anfängliche Lernrate von 0,1.

A.3 Uneinigkeitsmetriken

Wir definieren hier jede der sechs Übereinstimmungsmetriken, die in unserer Arbeit verwendet werden.

\ Die ersten vier Metriken hängen von den Top-𝑘 wichtigsten Merkmalen in jeder Erklärung ab. Lassen Sie 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) die Top-𝑘 wichtigsten Merkmale in einer Erklärung 𝐸 darstellen, lassen Sie 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) den Wichtigkeitsrang des Merkmals 𝑠 innerhalb der Erklärung 𝐸 sein, und lassen Sie 𝑠𝑖𝑔𝑛(𝐸, 𝑠) das Vorzeichen (positiv, negativ oder null) des Wichtigkeitswerts des Merkmals 𝑠 in der Erklärung 𝐸 sein.

\

\ Die nächsten zwei Übereinstimmungsmetriken hängen von allen Merkmalen innerhalb jeder Erklärung ab, nicht nur von den Top-𝑘. Lassen Sie 𝑅 eine Funktion sein, die die Rangfolge der Merkmale innerhalb einer Erklärung nach Wichtigkeit berechnet.

\

\ (Hinweis: Krishna et al. [15] geben in ihrem Papier an, dass 𝐹 eine vom Endbenutzer angegebene Menge von Merkmalen sein soll, aber in unseren Experimenten verwenden wir alle Merkmale mit dieser Metrik).

A.4 Ergebnisse des Junk-Feature-Experiments

Wenn wir zufällige Merkmale für das Experiment in Abschnitt 4.4 hinzufügen, verdoppeln wir die Anzahl der Merkmale. Wir tun dies, um zu überprüfen, ob unser Konsensverlust die Erklärungsqualität beeinträchtigt, indem irrelevante Merkmale häufiger in die Top-𝐾 aufgenommen werden als bei natürlich trainierten Modellen. In Tabelle 1 berichten wir den prozentualen Anteil der Zeit, in der jeder Erklärer eines der zufälligen Merkmale in die 5 wichtigsten Merkmale aufgenommen hat. Wir beobachten, dass wir über alle Bereiche hinweg keinen systematischen Anstieg dieser Prozentsätze zwischen 𝜆 = 0,0 (ein Baseline-MLP ohne unseren Konsensverlust) und 𝜆 = 0,5 (ein MLP, das mit unserem Konsensverlust trainiert wurde) sehen

\ Tabelle 1: Häufigkeit von Junk-Features, die Top-5-Ränge erhalten, gemessen in Prozent.

A.5 Weitere Uneinigkeitsmatrizen

Abbildung 9: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu Bank Marketing-Daten.

\ Abbildung 10: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu California Housing-Daten.

\ Abbildung 11: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu Electricity-Daten.

A.6 Erweiterte Ergebnisse

Tabelle 2: Durchschnittliche Testgenauigkeit für die von uns trainierten Modelle. Diese Tabelle ist nach Datensatz, Modell, den Hyperparametern im Verlust und dem Gewichtsverfallskoeffizienten (WD) organisiert. Durchschnitte sind über mehrere Versuche und wir berichten die Mittelwerte ± einen Standardfehler.

A.7 Zusätzliche Diagramme

Abbildung 12: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem Bank Marketing-Datensatz.

\ Abbildung 13: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem California Housing-Datensatz.

\ Abbildung 14: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem Electricity-Datensatz.

\ Abbildung 15: Zusätzliche Trade-off-Kurvendiagramme für alle Datensätze und Metriken.

\

:::info Autoren:

(1) Avi Schwarzschild, University of Maryland, College Park, Maryland, USA und Arbeit abgeschlossen während der Tätigkeit bei Arthur (avi1umd.edu);

(2) Max Cembalest, Arthur, New York City, New York, USA;

(3) Karthik Rao, Arthur, New York City, New York, USA;

(4) Keegan Hines, Arthur, New York City, New York, USA;

(5) John Dickerson†, Arthur, New York City, New York, USA ([email protected]).

:::


:::info Dieses Papier ist auf arxiv verfügbar unter der CC BY 4.0 DEED-Lizenz.

:::

\

Marktchance
SIX Logo
SIX Kurs(SIX)
$0.01306
$0.01306$0.01306
-2.09%
USD
SIX (SIX) Echtzeit-Preis-Diagramm
Haftungsausschluss: Die auf dieser Website veröffentlichten Artikel stammen von öffentlichen Plattformen und dienen ausschließlich zu Informationszwecken. Sie spiegeln nicht unbedingt die Ansichten von MEXC wider. Alle Rechte verbleiben bei den ursprünglichen Autoren. Sollten Sie der Meinung sein, dass Inhalte die Rechte Dritter verletzen, wenden Sie sich bitte an [email protected] um die Inhalte entfernen zu lassen. MEXC übernimmt keine Garantie für die Richtigkeit, Vollständigkeit oder Aktualität der Inhalte und ist nicht verantwortlich für Maßnahmen, die aufgrund der bereitgestellten Informationen ergriffen werden. Die Inhalte stellen keine finanzielle, rechtliche oder sonstige professionelle Beratung dar und sind auch nicht als Empfehlung oder Billigung von MEXC zu verstehen.

Das könnte Ihnen auch gefallen

Bitcoin- und KI-Aktienrutsch führt zur Auslöschung von bullischen Wetten im Wert von über 500 Millionen Dollar

Bitcoin- und KI-Aktienrutsch führt zur Auslöschung von bullischen Wetten im Wert von über 500 Millionen Dollar

Märkte Teilen Diesen Artikel teilen
Link kopierenX (Twitter)LinkedInFacebookEmail
Bitcoin, AI-Aktienrutsch verzeichnet über 500 Milli
Teilen
Coindesk2025/12/16 11:23
CME Group erweitert Krypto-Derivate mit Spot-notierten XRP- und SOL-Futures

CME Group erweitert Krypto-Derivate mit Spot-notierten XRP- und SOL-Futures

CME Group startet Spot-notierte XRP- und SOL-Futures und erweitert den auf den Einzelhandel ausgerichteten Krypto-Zugang mit längeren Laufzeiten und reduzierten Rollkosten. CME Group hat Spot
Teilen
LiveBitcoinNews2025/12/16 11:30
Solanas (SOL) jüngste Rally mag beeindrucken, aber Investoren, die auf lebensverändernde ROI abzielen, schauen woanders hin

Solanas (SOL) jüngste Rally mag beeindrucken, aber Investoren, die auf lebensverändernde ROI abzielen, schauen woanders hin

Der Beitrag Solanas (SOL) jüngste Rally mag beeindrucken, aber Investoren, die nach lebensverändernder Kapitalrendite (ROI) suchen, schauen woanders hin erschien auf BitcoinEthereumNews.com. Solanas (SOL) neueste Rally hat Investoren von überall angezogen, aber die größere Geschichte für zukunftsorientierte Investoren ist, wohin die nächsten Wellen lebensverändernder Renditen gehen werden. Während Solana weiterhin hohe Nutzungsraten des Ökosystems und Netzwerkauslastung verzeichnet, wird langsam die Bühne für Mutuum Finance (MUTM) bereitet. MUTM wird in seinem schnell wachsenden Vorverkauf mit 0,035 $ bewertet. Eine Preissteigerung von 14,3% ist das, was die Investoren in der nächsten Phase erwarten können. Über 15,85 Millionen Dollar wurden bereits gesammelt, während der Vorverkauf weiter an Dynamik gewinnt. Im Gegensatz zu den meisten Token, die auf kurzfristigen Hype-Wellen surfen, entwickelt sich Mutuum Finance zu einer nutzungsorientierten Wahl mit mehr Wertpotenzial und damit zu einer zunehmend besseren Option für Investoren, die mehr als nur Preisbewegungen suchen. Solana hält Gewinne nahe 234 $ während die Spekulation anhält Solana (SOL) wird derzeit bei 234,08 $ gehandelt und hält seine 24-Stunden-Spanne um 234,42 $ bis 248,19 $, was den jüngsten Trend veranschaulicht. Der Token hat starke Sieben-Tage-Gewinne von fast 13% verzeichnet, weit über den meisten seiner Mitbewerber, da er durch steigendes Volumen und institutionelle Käufe unterstützt wird. Der Widerstand liegt bei 250-260 $, und die Unterstützungsstufe scheint bei 220-230 $ zu liegen, und somit sind dies bedeutende Niveaus für potenzielle Ausbrüche oder Rückgänge. Allerdings wird die neue DeFi-Kryptowährung Mutuum Finance von Marktbeobachtern als potenziell aufstrebender betrachtet, da sie sich noch im Vorverkauf befindet. Mutuum Finance Phase 6 Vorverkauf Mutuum Finance befindet sich derzeit in der Vorverkaufsphase 6 und bietet Token für 0,035 $ an. Der Vorverkauf verlief sehr schnell, und Investoren haben über 15,85 Millionen Dollar aufgebracht. Das Projekt strebt auch einen USD-gebundenen Stablecoin auf der Ethereum-Blockchain für bequeme Zahlungen und als Bewahrer langfristigen Werts an. Mutuum Finance ist eine Dual-Lending-, Mehrzweck-DeFi-Plattform, die sowohl Kreditnehmern als auch Kreditgebern zugutekommt. Sie bietet das Netzwerk für den Einzelhandel sowie...
Teilen
BitcoinEthereumNews2025/09/18 06:23