БиржаDEX+

Купить крипто Рынки Спотовая ФьючерсыGOLD Сбережения Центр событий

Еще

Всем привет! Это Данила Ляпин, наставник курса «Специалист по Data Science». Собрал для вас подборку материалов по компьютерному зрению и обучению нейросетей. ЗВсем привет! Это Данила Ляпин, наставник курса «Специалист по Data Science». Собрал для вас подборку материалов по компьютерному зрению и обучению нейросетей. З

Компьютерное зрение и обучение нейросетей: 12 бесплатных ресурсов для погружения в тему

Автор: ProBlockChain

Источник: ProBlockChain

2026/02/16 12:05

5м. чтение

ML$0.00905-0.76%

Всем привет! Это Данила Ляпин, наставник курса «Специалист по Data Science». Собрал для вас подборку материалов по компьютерному зрению и обучению нейросетей. Здесь вы найдёте полноценные курсы, туториалы, обзорные статьи и справочные материалы. Подборка пригодится как новичкам в ML, так и практикующим инженерам — старался пояснять в описаниях, для кого подойдёт конкретный материал.

«Свёрточные нейросети», Яндекс Образование

Глава из учебника по машинному обучению о свёрточных нейросетях для распознавания изображений. Объясняется, почему полносвязные сети неэффективны для картинок, как работают свёртки и зачем нужна инвариантность к сдвигам.

Разбираются ключевые блоки: max pool, global average pool, residual connection, регуляризация через аугментации, label smoothing и mixup. В конце перечислены знаковые архитектуры, заметно повлиявшие на мир свёрточных нейронных сетей в задаче классификации картинок (и не только).

Перейти →

A Visual and Interactive Guide to the Basics of Neural Networks, Jay Alammar

Цель руководства — на простых примерах дать фундаментальное понимание того, как работает нейронная сеть и почему обучение сети связано с подбором правильных весов и смещений на основе данных. Автор объясняет концепции на примере предсказания цены дома. Повествование строится вокруг визуализации процесса: от базовой модели с одним входом и одним выходом к моделям с несколькими параметрами. На английском языке.

Перейти →

A Gentle Introduction to Padding and Stride for Convolutional Neural Networks, Machine Learning Mastery

Статья о том, как работают паддинг и страйд в свёрточных сетях. Автор на простых примерах объясняет, почему изображение уменьшается после применения фильтров (border effects), как padding помогает сохранить размер, а stride — уменьшить его специально. Подходит новичкам, на английском языке.

Перейти →

Computer Vision, бесплатный курс от Kaggle

Курс знакомит с фундаментальными идеями компьютерного зрения и тем, как нейронная сеть может «понимать» изображения, чтобы решать те же задачи, которые решает человеческая зрительная система. К концу курса вы сможете создавать классификаторы изображений уровня профессиональных приложений и будете готовы к более продвинутым темам вроде GAN и сегментации изображений. На английском языке.

Перейти →

Conv2d, PyTorch

Документация по двумерному свёрточному слою в PyTorch. Описывает назначение ‘torch.nn.Conv2d’, его входные и выходные данные, основные параметры (‘kernel_size’, ‘stride’, ‘padding’, ‘dilation’, ‘groups’ и так далее), а также ключевые переменные. На английском языке.

Перейти →

Data Preprocessing in PyTorch, Geeks for Geeks

Предобработка данных — критически важный шаг в любом ML-пайплайне, и PyTorch предлагает разнообразные инструменты и техники для этого процесса. В статье разбираются лучшие практики предобработки данных в PyTorch с фокусом на загрузку данных, нормализацию, трансформацию и аугментацию. Эти практики необходимы для подготовки данных к обучению модели, улучшения производительности модели и обеспечения обучения на высококачественных данных. На английском языке.

Перейти →

«История YOLO — самой известной архитектуры компьютерного зрения», Хабр DataSecrets

Эта статья — полноценная техно-история YOLO. Авторы рассказывают, что представляет из себя задача детекции, как работала самая первая YOLO и как её дорабатывали во всех последующих версиях. В тексте встречаются термины из машинного обучения, но в целом статья написана доступным языком и будет понятна и интересна как опытным читателям, так и начинающим.

Перейти →

Introduction into YOLO v3, Валентин Сичкар

Видеолекция, в которой автор объясняет, что такое YOLO в целом, разбирает архитектуру сети YOLO v3 и как она детектирует объекты на разных масштабах. Рассказывает, что такое anchor boxes и как вычисляются bounding boxes, объясняет процесс обучения сети и, в заключение, что такое objectness score. На английском языке.

«YOLOv4 — самая точная real-time нейронная сеть на датасете Microsoft COCO», Хабр AlexeyAB

Статья от разработчиков YOLOv4 и фреймворка Darknet. Автор сравнивает нейросети для детекции объектов по скорости и точности, показывает, почему YOLOv4 и DL-фреймворк Darknet работают быстрее и точнее, чем DL-фреймворки и нейронные сети: Google TensorFlow EfficientDet, Facebook* Detectron RetinaNet/MaskRCNN, PyTorch YOLOv3-ASFF и многие другие. При этом YOLOv4 требует в 5 раз более дешевое оборудование.

Автор делится сравнительными графиками, рассказывает об особенностях разработки и делится выводами о создании нейросетей для детекции. Много полезных ссылок на инструкции и код. Must-read.

*принадлежит компании Meta, деятельность которой признана экстремистской и запрещена на территории РФ.

Перейти →

What is torch.nn really?, PyTorch

Практическое объяснение того, как работают ключевые модули и классы PyTorch: ‘torch.nn’, ‘torch.optim’, ‘Dataset’ и ‘DataLoader’. Чтобы понять, что они делают, автор сначала обучает нейросеть на MNIST только с базовыми тензорными операциями, а затем постепенно добавляет по одному компоненту, показывая, как каждый делает код короче или гибче. Требует знания основ PyTorch и тензорных операций (или NumPy). Есть ссылка на ноутбук. На английском языке.

Перейти →

A Recipe for Training Neural Networks, Andrej Karpathy blog

Несмотря на большое количество библиотек и фреймворков, которые дают надежду на то, что технология работает «из коробки», обучать нейронные сети не так просто. Андрей Карпатый (Tesla, OpenAI) объясняет, почему это так и почему подход к обучению «быстрее, выше, сильнее» не работает и ведёт к дополнительным страданиям. Затем он подробно описывает свой подход и делится советами. Не подходит для абсолютных новичков. На английском языке.

Перейти →

CS231n Deep Learning for Computer Vision, Stanford CS

Культовый курс от Стэнфордского университета. В свободном доступе можно посмотреть лекции за разные годы, почитать конспекты и познакомиться с практическими заданиями. Считается одним из наиболее полных курсов, посвящённых компьютерному зрению, постоянно обновляется. Может быть сложен для восприятия, если вы абсолютный новичок и никогда не работали с Python. На английском языке.

Перейти к курсу →

Смотреть лекции →

Перейти к конспектам →

Источник

Возможности рынка

Mintlayer Курс (ML)

$0.00905

$0.00905$0.00905

-0.98%

USD

График цены Mintlayer (ML) в реальном времени

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.