Мы используем табличные наборы данных, изначально из OpenML и собранные в набор эталонных наборов данных от команды Inria-Soda на HuggingFace. Мы обучаем на 28 855 обучающих образцах и тестируем на оставшихся 9 619 образцах. Все MLP обучаются с размером пакета 64, 64 и 0,0005, и мы изучаем 3 слоя по 100 нейронов каждый. Здесь мы определяем шесть основных метрик, используемых в нашей работе.Мы используем табличные наборы данных, изначально из OpenML и собранные в набор эталонных наборов данных от команды Inria-Soda на HuggingFace. Мы обучаем на 28 855 обучающих образцах и тестируем на оставшихся 9 619 образцах. Все MLP обучаются с размером пакета 64, 64 и 0,0005, и мы изучаем 3 слоя по 100 нейронов каждый. Здесь мы определяем шесть основных метрик, используемых в нашей работе.

Руководство гика по экспериментам с машинным обучением

2025/09/21 13:47

Резюме и 1. Введение

1.1 Пост-хок объяснение

1.2 Проблема разногласий

1.3 Поощрение консенсуса объяснений

  1. Связанные работы

  2. Pear: Регуляризатор согласования пост-хок объяснений

  3. Эффективность обучения консенсусу

    4.1 Метрики согласования

    4.2 Улучшение метрик консенсуса

    [4.3 Согласованность какой ценой?]()

    4.4 Являются ли объяснения все еще ценными?

    4.5 Консенсус и линейность

    4.6 Два члена функции потерь

  4. Обсуждение

    5.1 Будущая работа

    5.2 Заключение, благодарности и ссылки

Приложение

A ПРИЛОЖЕНИЕ

A.1 Наборы данных

В наших экспериментах мы используем табличные наборы данных, изначально из OpenML и собранные в набор эталонных данных от команды Inria-Soda на HuggingFace [11]. Мы предоставляем некоторые детали о каждом наборе данных:

\ Bank Marketing Это набор данных бинарной классификации с шестью входными признаками и примерно сбалансированными классами. Мы обучаем на 7 933 обучающих образцах и тестируем на оставшихся 2 645 образцах.

\ California Housing Это набор данных бинарной классификации с семью входными признаками и примерно сбалансированными классами. Мы обучаем на 15 475 обучающих образцах и тестируем на оставшихся 5 159 образцах.

\ Electricity Это набор данных бинарной классификации с семью входными признаками и примерно сбалансированными классами. Мы обучаем на 28 855 обучающих образцах и тестируем на оставшихся 9 619 образцах.

A.2 Гиперпараметры

Многие из наших гиперпараметров постоянны во всех наших экспериментах. Например, все MLP обучаются с размером пакета 64 и начальной скоростью обучения 0,0005. Кроме того, все изучаемые нами MLP имеют 3 скрытых слоя по 100 нейронов каждый. Мы всегда используем оптимизатор AdamW [19]. Количество эпох варьируется от случая к случаю. Для всех трех наборов данных мы обучаем в течение 30 эпох, когда 𝜆 ∈ {0,0, 0,25}, и 50 эпох в остальных случаях. При обучении линейных моделей мы используем 10 эпох и начальную скорость обучения 0,1.

A.3 Метрики разногласий

Здесь мы определяем каждую из шести метрик согласования, используемых в нашей работе.

\ Первые четыре метрики зависят от топ-𝑘 наиболее важных признаков в каждом объяснении. Пусть 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) представляет топ-𝑘 наиболее важных признаков в объяснении 𝐸, пусть 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) будет рангом важности признака 𝑠 в объяснении 𝐸, и пусть 𝑠𝑖𝑔𝑛(𝐸, 𝑠) будет знаком (положительным, отрицательным или нулевым) оценки важности признака 𝑠 в объяснении 𝐸.

\

\ Следующие две метрики согласования зависят от всех признаков в каждом объяснении, а не только от топ-𝑘. Пусть 𝑅 будет функцией, которая вычисляет ранжирование признаков в объяснении по важности.

\

\ (Примечание: Krishna и др. [15] указывают в своей статье, что 𝐹 должен быть набором признаков, указанных конечным пользователем, но в наших экспериментах мы используем все признаки с этой метрикой).

A.4 Результаты эксперимента с бесполезными признаками

Когда мы добавляем случайные признаки для эксперимента в разделе 4.4, мы удваиваем количество признаков. Мы делаем это, чтобы проверить, ухудшает ли наша функция потерь консенсуса качество объяснения, помещая нерелевантные признаки в топ-𝐾 чаще, чем модели, обученные естественным образом. В Таблице 1 мы сообщаем процент случаев, когда каждый объяснитель включал один из случайных признаков в топ-5 наиболее важных признаков. Мы наблюдаем, что в целом мы не видим систематического увеличения этих процентов между 𝜆 = 0,0 (базовый MLP без нашей функции потерь консенсуса) и 𝜆 = 0,5 (MLP, обученный с нашей функцией потерь консенсуса)

\ Таблица 1: Частота попадания бесполезных признаков в топ-5 рангов, измеренная в процентах.

A.5 Дополнительные матрицы разногласий

Рисунок 9: Матрицы разногласий для всех метрик, рассмотренных в этой статье, на данных Bank Marketing.

\ Рисунок 10: Матрицы разногласий для всех метрик, рассмотренных в этой статье, на данных California Housing.

\ Рисунок 11: Матрицы разногласий для всех метрик, рассмотренных в этой статье, на данных Electricity.

A.6 Расширенные результаты

Таблица 2: Средняя точность тестирования для обученных нами моделей. Эта таблица организована по набору данных, модели, гиперпараметрам в функции потерь и коэффициенту затухания весов (WD). Средние значения приведены по нескольким испытаниям, и мы сообщаем средние значения ± одна стандартная ошибка.

A.7 Дополнительные графики

Рисунок 12: Поверхности логитов для MLP, каждая обученная с разным значением лямбда, на 10 случайно построенных трехточечных плоскостях из набора данных Bank Marketing.

\ Рисунок 13: Поверхности логитов для MLP, каждая обученная с разным значением лямбда, на 10 случайно построенных трехточечных плоскостях из набора данных California Housing.

\ Рисунок 14: Поверхности логитов для MLP, каждая обученная с разным значением лямбда, на 10 случайно построенных трехточечных плоскостях из набора данных Electricity.

\ Рисунок 15: Дополнительные графики кривых компромисса для всех наборов данных и метрик.

\

:::info Авторы:

(1) Ави Шварцшильд, Университет Мэриленда, Колледж-Парк, Мэриленд, США и работа выполнена во время работы в Arthur (avi1umd.edu);

(2) Макс Цембалест, Arthur, Нью-Йорк, Нью-Йорк, США;

(3) Картик Рао, Arthur, Нью-Йорк, Нью-Йорк, США;

(4) Киган Хайнс, Arthur, Нью-Йорк, Нью-Йорк, США;

(5) Джон Дикерсон†, Arthur, Нью-Йорк, Нью-Йорк, США ([email protected]).

:::


:::info Эта статья доступна на arxiv под лицензией CC BY 4.0 DEED.

:::

\

Возможности рынка
Логотип SIX
SIX Курс (SIX)
$0.01306
$0.01306$0.01306
-2.09%
USD
График цены SIX (SIX) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

CME Group расширяет криптодеривативы с фьючерсами на XRP и SOL с котировками по спотовым ценам

CME Group расширяет криптодеривативы с фьючерсами на XRP и SOL с котировками по спотовым ценам

CME Group запускает фьючерсы на XRP и SOL с котировками спот, расширяя доступ к криптовалютам для розничных клиентов с более длительными сроками истечения и сниженными затратами на ролловер. CME Group запустила спот
Поделиться
LiveBitcoinNews2025/12/16 11:30
Недавний рост Solana (SOL) может впечатлять, но инвесторы, нацеленные на ROI, способный изменить жизнь, смотрят в другом направлении

Недавний рост Solana (SOL) может впечатлять, но инвесторы, нацеленные на ROI, способный изменить жизнь, смотрят в другом направлении

Пост «Недавний рост Solana (SOL) может впечатлять, но инвесторы, нацеленные на изменяющий жизнь ROI, смотрят в другом направлении» появился на BitcoinEthereumNews.com. Последний рост Solana (SOL) привлек инвесторов со всего мира, но более важная история для дальновидных инвесторов заключается в том, куда направляются следующие волны доходности, способной изменить жизнь. Поскольку Экосистема Solana продолжает демонстрировать высокий уровень использования и загрузки сети, постепенно создаются условия для Mutuum Finance (MUTM). MUTM оценивается в 0,035 $ в своей быстрорастущей предпродаже. Рост цены на 14,3% — это то, что инвесторы ожидают на следующем этапе. Более 15,85 миллионов $ уже собрано, и предпродажа продолжает набирать обороты. В отличие от большинства токенов, которые используют краткосрочные волны хайпа, Mutuum Finance становится выбором, ориентированным на полезность, с большим потенциалом стоимости и, следовательно, все более привлекательным вариантом для инвесторов, ищущих больше, чем просто движение цены. Solana сохраняет прибыль около 234 $ на фоне продолжающихся спекуляций Solana (SOL) в настоящее время торгуется по цене 234,08 $, удерживая свой 24-часовой диапазон около 234,42 $ - 248,19 $, что иллюстрирует недавний тренд. Токен зафиксировал сильный семидневный рост почти на 13%, значительно превосходя большинство своих конкурентов, поскольку его поддерживают растущий объем и институциональные покупки. Сопротивление находится на уровне 250-260 $, а поддержка, по-видимому, на уровне 220-230 $, и, таким образом, это значимые уровни для потенциального прорыва или отката. Однако новая DeFi криптовалюта Mutuum Finance, по мнению рыночных наблюдателей, имеет больший потенциал роста, находясь еще на стадии предпродажи. Предпродажа Mutuum Finance Фаза 6 Mutuum Finance в настоящее время находится на 6 этапе предпродажи и предлагает токены по цене 0,035 $. Предпродажа идет очень быстро, и инвесторы уже собрали более 15,85 миллионов $. Проект также планирует создать стейблкоин, привязанный к доллару США, на блокчейн Ethereum для удобных платежей и в качестве хранителя долгосрочной стоимости. Mutuum Finance — это двусторонняя кредитная, многоцелевая DeFi платформа, которая приносит пользу как заемщикам, так и кредиторам. Она предоставляет сеть для розничных, а также...
Поделиться
BitcoinEthereumNews2025/09/18 06:23
Bank of America: Банковская индустрия США движется к многолетней фазе он-чейн развития.

Bank of America: Банковская индустрия США движется к многолетней фазе он-чейн развития.

PANews сообщил 16 декабря, ссылаясь на CoinDesk, что Bank of America заявил в понедельник в отчете, что политика в отношении криптовалюты переходит от обсуждения к реализации
Поделиться
PANews2025/12/16 10:43