ImageNet

База данных ImageNet — проект по созданию и сопровождению массивной базы данных аннотированных изображений, предназначенная для отработки и тестирования методов распознавания образов и машинного зрения. По состоянию на 2016 год в базу данных было записано около десяти миллионов URL с изображениями, которые прошли ручную аннотацию для ImageNet, в аннотациях перечислялись объекты, попавшие на изображение, и прямоугольники с их координатами.[1] База данных с аннотацией и URL изображений от третьих лиц доступна непосредственно через ImageNet, но при этом сами изображения не принадлежат проекту[2]. С 2010 года ведётся проект ILSVRC (англ. ImageNet Large Scale Visual Recognition Challenge — Кампания по широкомасштабному распознаванию образов в ImageNet), в рамках которого различные программные продукты ежегодно соревнуются в классификации и распознавании объектов и сцен в базе данных ImageNet.

Состав базы данных

ImageNet использует краудсорсинг для аннотирования изображений.

Аннотации на уровне самих изображений показывают наличие или отсутствие объекта данного класса (например, «на картинке имеется тигр» или «на картинке нет тигров»). На уровне объекта в аннотацию включается прямоугольник с координатами видимой части объекта. ImageNet использует вариант семантической сети WordNet для категоризации объектов, которая достаточно детализирована, например, породы собак представлены 120 классами. Каждому узлу сети WordNet сопоставлены сотни или тысячи изображений, но в среднем на 2016 год — около 500 изображений[3].

На август 2017 года в ImageNet 14 197 122 изображения, разбитых на 21 841 категорию.

Кампания ImageNet

С 2010 года в рамках проекта ILSVRC проводятся соревнования между исследовательскими группами по классификации объектов. ILSVCR возникла по аналогии с небольшой кампанией 2005 года PASCAL VOC, которая располагала набором из 20 тысяч изображений и 20 классов объектов[3]. Существенный прогресс в распознавании образов был достигнут в 2010 году. В 2011 году хорошим результатом считалась ошибка классификации 25 %. В 2012 году система глубокого обучения на основе свёрточной нейронной сети смогла достичь 16 % ошибки; а в следующие годы ошибка упала до нескольких процентов[4]. В 2015 году исследователи констатировали, что программы в определённых задачах проекта ILSVRC превзошли человеческие способности[5]. Однако, как указывала Ольга Руссаковская, одна из организаторов кампании, программы пока должны определять объекты для одной из тысячи категорий, а люди могут распознать большее количество категорий и (в отличие от программ) могут ещё и обозначить контекст изображений[6].

В 2014 году к кампании подключилось более 50 организаций[3]. В 2015 году исследователей из проекта Baidu дисквалифицировали на год, потому что они вошли в проект под несколькими разными именами, чтобы обойти ограничения по двум поставкам в неделю[7][8]. Позднее Baidu заявило, что руководитель группы был уволен, и что будет собрана специальная научно-консультативная группа[9].

См. также

Примечания

ImageNet Summary and Statistics (неопр.) (недоступная ссылка). ImageNet. Дата обращения: 22 июня 2016. Архивировано 20 марта 2019 года.
ImageNet Overview (неопр.) (недоступная ссылка). ImageNet. Дата обращения: 22 июня 2016. Архивировано 4 июля 2016 года.
Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.
Does an AI need to make love to Rembrandt’s girlfriend to make art?, The Guardian (6 May 2016). Дата обращения 22 июня 2016.
A Learning Advance in Artificial Intelligence Rivals Human Abilities, The New York Times (10 December 2015). Дата обращения 22 июня 2016.
Forget the Turing test – there are better ways of judging AI, New Scientist (21 September 2015). Дата обращения 22 июня 2016.
Computer Scientists Are Astir After Baidu Team Is Barred From A.I. Competition, The New York Times (3 June 2015). Дата обращения 22 июня 2016.
Chinese search giant Baidu disqualified from AI test, BBC News (14 June 2015). Дата обращения 22 июня 2016.
Baidu fires researcher involved in AI contest flap, PCWorld (11 June 2015). Дата обращения 22 июня 2016.

Ссылки

image-net.org — официальный сайт ImageNet

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] ImageNet Summary and Statistics (неопр.) (недоступная ссылка). ImageNet. Дата обращения: 22 июня 2016. Архивировано 20 марта 2019 года.

[2] ImageNet Overview (неопр.) (недоступная ссылка). ImageNet. Дата обращения: 22 июня 2016. Архивировано 4 июля 2016 года.

[ILJVRC-2015-3] Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.

[4] Does an AI need to make love to Rembrandt’s girlfriend to make art?, The Guardian (6 May 2016). Дата обращения 22 июня 2016.

[5] A Learning Advance in Artificial Intelligence Rivals Human Abilities, The New York Times (10 December 2015). Дата обращения 22 июня 2016.

[6] Forget the Turing test – there are better ways of judging AI, New Scientist (21 September 2015). Дата обращения 22 июня 2016.

[7] Computer Scientists Are Astir After Baidu Team Is Barred From A.I. Competition, The New York Times (3 June 2015). Дата обращения 22 июня 2016.

[8] Chinese search giant Baidu disqualified from AI test, BBC News (14 June 2015). Дата обращения 22 июня 2016.

[9] Baidu fires researcher involved in AI contest flap, PCWorld (11 June 2015). Дата обращения 22 июня 2016.