Тесты Бонгарда

Известный советский кибернетик Михаил Моисеевич Бонгард одним из первых разработал теорию распознавания образов. В 1967 году вышла его книга Проблема узнавания, и в ней были приведены сто немного искусственных, но понятных картинок, на которых можно проиллюстрировать практически все характерные особенности того, что мы сейчас называем машинным обучением.Машинное обучениеНа первой картинке изображены шесть объектов одного класса и шесть объектов другого класса. Представьте себя на месте искусственного интеллекта, которому показывают это. Вы должны выработать правило, согласно которому можете отличить объекты слева от объектов справа. Каждый из нас по очень простому примеру за считаные секунды догадается, о чем идет речь: в данном случае мы отличаем большие фигуры от маленьких.

Глядя на вторую картинку, мы понимаем, что здесь различаются четырехугольники и треугольники. Почему вообще возможно автоматически отличить объекты одного класса от объектов другого класса и почему мы уверены в том, что то правило, которое мы нашли, о различии четырехугольников и треугольников верное? Первое, что приходит в голову: благодаря этому правилу мы безошибочно распознаем двенадцать объектов.

Третья картинка сложнее, не все сразу догадываются, о чем идет речь. В данном случае можно выработать следующее общее правило: фигуры слева вытянутые, а у фигур справа выпуклая оболочка имеет примерно одинаковую длину и ширину. Но здесь мы уже начинаем апеллировать к геометрическим понятиям. И опять же мы считаем, что найден правильный принцип классификации этих объектов, потому что удалось сформулировать это в виде короткого правила.

Итак, можно сформулировать общий ответ на вопрос Почему работает машинное обучение?. Во-первых, мы совершаем мало ошибок на обучающей выборке. Во-вторых, мы выработали правило, которое, с одной стороны, достаточно простое, а с другой объясняет всю обучающую выборку.Работая с четвертой картинкой, мы быстро распознаем, что спирали различаются направлением закручивания. Представьте, как этот принцип классификации мог бы выработать компьютер. Сейчас мы видим битмапы, то есть фотографии картинок, чертежей, и фотография может быть размером 100 на 100 или 1000 на 1000 пикселей. Компьютерная программа должна каким-то образом обработать отсканированную картинку, а потом понять, что на ней является спиралью.

Определить направление, в котором спираль закручена, это еще более тонкая задача. Как можно научить компьютер различать столь тонкие геометрические объекты? Придется каким-то образом закладывать в него те понятия, которые мы уже давно считаем очевидными: мы живем в трехмерном мире, где встречаются спирали, а кроме того, на уроках в школе изучали геометрические фигуры, поэтому подобные задачи мы решаем очень легко и интуитивно. Но для компьютерной программы, у которой не было уроков по геометрии, эта задача будет безумно трудной.На пятой картинке с одной стороны больше темных фигур, а на другой светлых, и мы это буквально за секунду интуитивно понимаем. Компьютеру будет трудно это определить: для начала ему надо объяснить, что такое геометрическая фигура окружность, квадрат, треугольник и что она бывает закрашенной или незакрашенной. Встает вопрос: чтобы научить компьютер решать подобные задачи, каков должен быть объем знаний в области геометрии, которые мы должны в него заложить?

На шестой картинке задача для компьютера усложняется еще больше. Здесь необходимо заложить в него понятие непрерывной кривой: что такое точка излома, касательная и как определить, что две фигуры касаются друг друга. Это большой пласт понятий из геометрии, которые нужно вкладывать в компьютер либо как априорные знания о мире, либо с помощью большой обучающей выборки из подобных картинок, чтобы компьютер сам выработал какие-то понятия из геометрии.

Здесь мы сталкиваемся с дилеммой, которую искусственный интеллект уже прошел: либо идем по пути развития экспертных систем и систем, основанных на непосредственном вкладывании знаний экспертов в компьютерную программу, либо накапливаем огромные объемы обучающих выборок и заставляем компьютерную программу саму выработать все необходимые понятия для решения задачи. Во втором случае необходимо подать на вход компьютеру не один миллион подобных тестов Бонгарда тогда можно надеяться, что компьютер научится с легкостью решать такие задачи.Понятие предрассудкаБонгард ввел также понятие предрассудка сегодня мы называем это переобучением. По обучающей выборке мы видим какое-то правило и задаемся вопросом: не ошиблись ли мы? В повседневной жизни это явление постоянно нам встречается. Люди наблюдают происходящее вокруг, но могут делать неправильные выводы: либо не хватило количества прецедентов, либо слишком разнообразно множество моделей, которые можно построить, или решений, которые можно принять. Человек имеет дело с небольшим количеством примеров, под которые вроде бы подходит то или иное объяснение, но оно оказывается ошибочным, то есть предрассудком.Седьмая картинка иллюстрирует еще одну возможную ситуацию. Здесь рисунок Бонгарда специально покрашен в черный цвет, чтобы стало видно, что эту выборку могут объяснить два правила. Бонгард всегда старался, чтобы правило было одно-единственное, но в этом случае нам сложно выбрать что-то одно: мы понимаем, что две выборки различаются тем, что одна симметрична, а другая нет, но эти же выборки различаются и тем, что одна черная, а другая белая. Какое правило предпочесть? С подобной ситуацией постоянно сталкиваются методы машинного обучения: всегда приходится выбирать модель из огромного количества возможных вариантов, при этом выбор приходится делать в условиях ограниченной информации, конечной обучающей выборки. Как сделать этот выбор надежным это тоже фундаментальная проблема, которая стоит перед машинным обучением.

Глядя на следующую картинку, мы понимаем, что здесь действует простое правило: ягодка находится либо на центральной ветви дерева, либо на боковой. Но для того, чтобы компьютер смог решить эту задачу, мы должны заложить в него и основы теории графов, и понятие непрерывной кривой ветки, а также что значит, когда ягодка или кружочек находится на кончике ветки. Мы снова сталкиваемся с необходимостью каким-то образом закладывать в компьютер знания.

Что самое удивительное, проблемы предварительной обработки сложно устроенного объекта, такого как изображение, а также вопросы переобучения (предрассудков) и достаточности объема обучающей выборки обсуждались в книге Бонгарда, которая была написана в 1967 году, и до сих пор эти проблемы остаются основополагающими в теории машинного обучения.

Источник: postnauka.ru

К списку статей

admin

Опубликовано: 21.09.2020 16:18:06

Сейчас читают

Что древние цивилизации думали о солнечных затмениях самые интересные варианты

Нейросеть Sora превращает текст в видео можно ли пользоваться ею прямо сейчас?

Электромобили смогут проезжать более 1000 км от одного заряда благодаря новой технологии

Комментариев (0)

Имя

Электронная почта

Общее

5 фактов о магии

В колдовство верили вездеВ 1980 году американский антрополог Джордж Мердок опубликовал книгу Теория болезней. В этой книге он привел сведения по 139 обществам, известным на тот момент, в основном доиндустриальным, домодерным. Мердок сгруппировал по типам все теории болезни, объяснения причин и способы их лечения и обнаружил, что такая причина болезней, как колдовство, распространена почти повсеместно. Из 139 обществ она встречается в 132, и лишь в 7 обществах ее нет или она не зафиксирована.Вера
5 фактов о математике

Многовариантность доказательства математической теоремы отнюдь не требуется: перечисление всех случаев одна из наиболее скучных форм математического доказательства. Математическое доказательство должно напоминать созвездие с ясными и четкими очертаниями, а не скопление звезд с размытыми границами в Млечном Пути, Годфри Харди, Апология Математика.Математика продолжает интуициюХотя математика дисциплина точная, нередко прорывы в ее области совершаются интуитивно. Математик говорит: мне кажется, чт
Где живет иммунитет и каким он бывает?

Иммунитет система, которая во многом определяет качество нашей жизни и потому представляет интерес для каждого читателя. При этом разобраться в работе иммунного аппарата не так легко он многокомпонентен и непосредственно связан с работой самых разных органов, а также имеет индивидуальные характеристики в каждом отдельном случае.Говорим об иммунитете с кандидато
5 фактов о языке

Долгое время язык не был проблемой философии она оставалась равнодушной к языку. Первым периодом, когда язык стал интересен, было раннее Средневековье. В процессе толкования священных текстов стали замечать, что язык не является чем-то нейтральным и прозрачным, что он представляет собой трудность, которая заслоняет смыслы от того, кто к этим смыслам пробирается. В XX веке языком начинают активно интересоваться, его рассматривают как содержательную структуру, действующую по своим собственным зако
5 фактов об ученых

За долгие годы работы команда ПостНауки повстречалась с тысячами ученых разных уровней, направлений и из разных стран. Что они рассказывают о себе, своем научном направлении и о том, каково быть ученым? Об этом мы решили собрать подборку интересных диалогов.Физики это люди против правилПо мнению физика Айка Саркисяна, все физики друг на друга во многом похожи: они свободно одеваются, шутят похожие шутки и даже слушают одну и ту же музыку независимо от того, в какой стране они живут.Однажды делег
5 фактов о потреблении

О потреблении в современном обществе, обществе модерна, начали говорить только после Второй мировой войны. Дело в том, что классическая теоретическая мысль модерна была сконцентрирована на производстве и труде. Вопросы потребления стали значимыми лишь тогда, когда значительная часть населения смогла обеспечить себя ресурсами и досугом. Это стало возможным лишь в развитых странах и преимущественно во второй половине XX века.Демонстративное потреблениеМы не просто лично хотим удовлетворить свои ба

Тесты Бонгарда

Сейчас читают

Общее

5 фактов о магии

5 фактов о математике

Где живет иммунитет и каким он бывает?

5 фактов о языке

5 фактов об ученых

5 фактов о потреблении

Категории

Последние комментарии

	Русский
	English