Utilizamos conjuntos de dados tabulares originalmente do OpenML e compilados num conjunto de conjuntos de dados de referência da equipa Inria-Soda no HuggingFace. Treinamos com 28.855 amostras de treino e testamos nas restantes 9.619 amostras. Todos os MLPs são treinados com um tamanho de lote de 64, 64, e 0,0005, e estudamos 3 camadas de 100 neurónios cada. Definimos aqui as seis principais métricas utilizadas no nosso trabalho.Utilizamos conjuntos de dados tabulares originalmente do OpenML e compilados num conjunto de conjuntos de dados de referência da equipa Inria-Soda no HuggingFace. Treinamos com 28.855 amostras de treino e testamos nas restantes 9.619 amostras. Todos os MLPs são treinados com um tamanho de lote de 64, 64, e 0,0005, e estudamos 3 camadas de 100 neurónios cada. Definimos aqui as seis principais métricas utilizadas no nosso trabalho.

O Guia do Geek para Experimentação em ML

2025/09/21 13:47

Abstrato e 1. Introdução

1.1 Explicação Post Hoc

1.2 O Problema da Discordância

1.3 Incentivando o Consenso de Explicação

  1. Trabalhos Relacionados

  2. Pear: Regularizador de Concordância de Explicador Post HOC

  3. A Eficácia do Treinamento de Consenso

    4.1 Métricas de Concordância

    4.2 Melhorando as Métricas de Consenso

    [4.3 Consistência a Que Custo?]()

    4.4 As Explicações Ainda São Valiosas?

    4.5 Consenso e Linearidade

    4.6 Dois Termos de Perda

  4. Discussão

    5.1 Trabalhos Futuros

    5.2 Conclusão, Agradecimentos e Referências

Apêndice

A APÊNDICE

A.1 Conjuntos de Dados

Nos nossos experimentos, utilizamos conjuntos de dados tabulares originalmente do OpenML e compilados num conjunto de conjuntos de dados de referência da equipa Inria-Soda no HuggingFace [11]. Fornecemos alguns detalhes sobre cada conjunto de dados:

\ Bank Marketing Este é um conjunto de dados de classificação binária com seis características de entrada e é aproximadamente equilibrado em termos de classe. Treinamos com 7.933 amostras de treino e testamos nas restantes 2.645 amostras.

\ California Housing Este é um conjunto de dados de classificação binária com sete características de entrada e é aproximadamente equilibrado em termos de classe. Treinamos com 15.475 amostras de treino e testamos nas restantes 5.159 amostras.

\ Electricity Este é um conjunto de dados de classificação binária com sete características de entrada e é aproximadamente equilibrado em termos de classe. Treinamos com 28.855 amostras de treino e testamos nas restantes 9.619 amostras.

A.2 Hiperparâmetros

Muitos dos nossos hiperparâmetros são constantes em todas as nossas experiências. Por exemplo, todos os MLPs são treinados com um tamanho de lote de 64 e uma taxa de aprendizagem inicial de 0,0005. Além disso, todos os MLPs que estudamos têm 3 camadas ocultas de 100 neurónios cada. Utilizamos sempre o otimizador AdamW [19]. O número de épocas varia de caso para caso. Para os três conjuntos de dados, treinamos durante 30 épocas quando 𝜆 ∈ {0,0, 0,25} e 50 épocas nos outros casos. Ao treinar modelos lineares, utilizamos 10 épocas e uma taxa de aprendizagem inicial de 0,1.

A.3 Métricas de Discordância

Definimos aqui cada uma das seis métricas de concordância utilizadas no nosso trabalho.

\ As primeiras quatro métricas dependem das características mais importantes top-𝑘 em cada explicação. Seja 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) representando as características mais importantes top-𝑘 numa explicação 𝐸, seja 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) a classificação de importância da característica 𝑠 dentro da explicação 𝐸, e seja 𝑠𝑖𝑔𝑛(𝐸, 𝑠) o sinal (positivo, negativo ou zero) da pontuação de importância da característica 𝑠 na explicação 𝐸.

\

\ As próximas duas métricas de concordância dependem de todas as características dentro de cada explicação, não apenas do top-𝑘. Seja 𝑅 uma função que calcula a classificação das características dentro de uma explicação por importância.

\

\ (Nota: Krishna et al. [15] especificam no seu artigo que 𝐹 deve ser um conjunto de características especificado por um utilizador final, mas nas nossas experiências utilizamos todas as características com esta métrica).

A.4 Resultados da Experiência com Características Inúteis

Quando adicionamos características aleatórias para a experiência na Secção 4.4, duplicamos o número de características. Fazemos isto para verificar se a nossa perda de consenso prejudica a qualidade da explicação, colocando características irrelevantes no top-𝐾 com mais frequência do que modelos treinados naturalmente. Na Tabela 1, relatamos a percentagem de vezes que cada explicador incluiu uma das características aleatórias nas 5 características mais importantes. Observamos que, em geral, não vemos um aumento sistemático dessas percentagens entre 𝜆 = 0,0 (um MLP de referência sem a nossa perda de consenso) e 𝜆 = 0,5 (um MLP treinado com a nossa perda de consenso)

\ Tabela 1: Frequência de características inúteis obtendo classificações top-5, medida em percentagem.

A.5 Mais Matrizes de Discordância

Figura 9: Matrizes de discordância para todas as métricas consideradas neste artigo sobre dados de Bank Marketing.

\ Figura 10: Matrizes de discordância para todas as métricas consideradas neste artigo sobre dados de California Housing.

\ Figura 11: Matrizes de discordância para todas as métricas consideradas neste artigo sobre dados de Electricity.

A.6 Resultados Estendidos

Tabela 2: Precisão média de teste para os modelos que treinamos. Esta tabela está organizada por conjunto de dados, modelo, os hiperparâmetros na perda e o coeficiente de decaimento de peso (WD). As médias são sobre várias tentativas e relatamos as médias ± um erro padrão.

A.7 Gráficos Adicionais

Figura 12: As superfícies logit para MLPs, cada uma treinada com um valor lambda diferente, em 10 planos de três pontos construídos aleatoriamente do conjunto de dados Bank Marketing.

\ Figura 13: As superfícies logit para MLPs, cada uma treinada com um valor lambda diferente, em 10 planos de três pontos construídos aleatoriamente do conjunto de dados California Housing.

\ Figura 14: As superfícies logit para MLPs, cada uma treinada com um valor lambda diferente, em 10 planos de três pontos construídos aleatoriamente do conjunto de dados Electricity.

\ Figura 15: Gráficos adicionais de curvas de trade-off para todos os conjuntos de dados e métricas.

\

:::info Autores:

(1) Avi Schwarzschild, Universidade de Maryland, College Park, Maryland, EUA e Trabalho concluído enquanto trabalhava na Arthur (avi1umd.edu);

(2) Max Cembalest, Arthur, Nova Iorque, Nova Iorque, EUA;

(3) Karthik Rao, Arthur, Nova Iorque, Nova Iorque, EUA;

(4) Keegan Hines, Arthur, Nova Iorque, Nova Iorque, EUA;

(5) John Dickerson†, Arthur, Nova Iorque, Nova Iorque, EUA ([email protected]).

:::


:::info Este artigo está disponível no arxiv sob licença CC BY 4.0 DEED.

:::

\

Oportunidade de mercado
Logo de SIX
Cotação SIX (SIX)
$0,01325
$0,01325$0,01325
-0,67%
USD
Gráfico de preço em tempo real de SIX (SIX)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail [email protected] para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

Você também pode gostar

Metaplanet forma subsidiárias focadas em Bitcoin no Japão e nos EUA.

Metaplanet forma subsidiárias focadas em Bitcoin no Japão e nos EUA.

A publicação "Metaplanet Forma Subsidiárias Focadas em Bitcoin no Japão e nos EUA" apareceu no BitcoinEthereumNews.com. A Metaplanet (3350), a maior empresa de tesouraria de Bitcoin no Japão, disse que estabeleceu duas subsidiárias — uma no Japão e outra nos EUA — e comprou o nome de domínio bitcoin.jp enquanto fortalece seu compromisso com a maior criptomoeda. A Bitcoin Japan Inc. será sediada em Tóquio e administrará um conjunto de mídias, conferências e plataformas online relacionadas ao Bitcoin, incluindo o domínio de internet e a Bitcoin Magazine Japan. A unidade americana, Metaplanet Income Corp., será sediada em Miami e focará na geração de renda a partir de produtos financeiros relacionados ao Bitcoin, incluindo derivativos, disse a empresa em uma publicação no X. A Metaplanet observou que lançou um negócio de geração de renda com Bitcoin no último trimestre de 2024 e pretende expandir ainda mais essas operações através da nova subsidiária. Ambas as subsidiárias de propriedade integral são lideradas em parte pelo CEO da Metaplanet, Simon Gerovich. No início deste mês, a empresa elevou suas reservas de Bitcoin para mais de 20.000 BTC. Atualmente, é a sexta maior empresa de tesouraria de Bitcoin do mundo, com 20.136 BTC em seu balanço, de acordo com dados da BitcoinTreasuries. A empresa líder, Strategy (MSTR), possui 638.985 BTC. As subsidiárias estão sendo estabelecidas logo após a empresa anunciar planos para levantar 204,1 bilhões de ienes líquidos (1,4 bilhão de dólares) em uma venda internacional de ações para reforçar suas reservas de BTC. As ações da Metaplanet caíram 1,16% na quarta-feira. Fonte: https://www.coindesk.com/business/2025/09/17/metaplanet-sets-up-u-s-japan-subsidiaries-buys-bitcoin-jp-domain-name
Compartilhar
BitcoinEthereumNews2025/09/18 06:12
Consumidores e vendedores precisam desse alerta sobre comprovantes em 2025

Consumidores e vendedores precisam desse alerta sobre comprovantes em 2025

Vender um produto online ou prestar um serviço traz a expectativa imediata do pagamento, mas criminosos exploram essa confiança com recibos editados ou agendame
Compartilhar
Monitordomercado2025/12/16 06:17
WhiteBIT Anuncia Promoção Global de Trading com TradingView e Tether, Oferecendo Até 30% de Cashback

WhiteBIT Anuncia Promoção Global de Trading com TradingView e Tether, Oferecendo Até 30% de Cashback

A WhiteBIT, uma das maiores exchanges de criptomoedas da Europa em volume de negociação e tráfego, lançou uma nova promoção global em parceria com a TradingView
Compartilhar
Cointimes2025/12/16 06:29