Сеть отношений
Сеть отношений ( RN ) — это компонент искусственной нейронной сети со структурой, которая может рассуждать об отношениях между объектами. Примером категории таких отношений являются пространственные отношения (сверху, снизу, слева, справа, спереди, сзади). [1]
RN могут выводить отношения, они эффективны в отношении данных и работают с набором объектов без учета порядка объектов. [1]
История
[ редактировать ]В июне 2017 года DeepMind анонсировала первую сеть взаимоотношений. В нем утверждалось, что технология достигла «сверхчеловеческой» производительности при решении множества задач, связанных с ответами на вопросы . [1]
Набор данных | Точность | Примечания |
---|---|---|
CleVR (пиксель) | 95.5% | Изображения 3D-объектов, таких как сферы и цилиндры. Типы вопросов: запросы «атрибутов» («Какого цвета сфера?», запросы «сравнить атрибуты» («Куб состоит из того же материала, что и цилиндр?»), запросы «подсчета» («Сколько сфер?» ) |
CleVR (описание состояния) | 96.4% | Изображения, представленные матрицами описания состояния. Каждая строка матрицы содержала характеристики одного объекта: координаты (x, y, z); цвет (р, г, б); форма (куб, цилиндр,...); материал (резина, металл,...); размер (маленький, большой,...). |
Что-то вроде CLEVR | 94% | 2D-изображения, каждое из которых содержит 6 квадратов и/или кругов 6 цветов. Вопросы кодируются как двоичные числа фиксированной длины, что исключает сложности с анализом естественного языка. Каждое изображение содержит 10 реляционных вопросов («Какова форма объекта, который находится дальше всего от серого объекта?») и 10 нереляционных вопросов («Какова форма серого объекта?»). |
свинья | 90% | Текстовые данные. 20 заданий, каждое из которых требует определенного типа рассуждений, например дедукции, индукции или счета. Каждый вопрос связан с набором поддерживающих предложений. Например, предложения «Сандра взяла футбольный мяч» и «Сандра пошла в офис» поддерживают вопрос «Где футбольный мяч?» (ответ: «офис»). Каждое предложение обрабатывается отдельно. Порог успеха составляет 95%. 10 тысяч записей. |
Динамическая физическая система | 93% подключений
/95% подсчет |
Шарики, движущиеся по поверхности, с упругими и неупругими связями. Один тест определил, соединены ли пары шаров. Другой определял количество подключенных. |
Дизайн
[ редактировать ]RN ограничивают функциональную форму нейронной сети, чтобы уловить общие свойства реляционного мышления. Эти свойства явно добавляются в систему, а не устанавливаются в результате обучения, точно так же, как способность рассуждать о пространственных, трансляционно-инвариантных свойствах явно является частью сверточных нейронных сетей (CNN). Рассматриваемые данные могут быть представлены в виде простого списка или ориентированного графа, узлами которого являются объекты, а ребрами — пары объектов, отношения которых необходимо учитывать. RN представляет собой сложную функцию:
где вход представляет собой набор «объектов» это я й объект, а fφ и gθ — функции с параметрами φ и θ соответственно, а q — вопрос. fφ и gθ — это многослойные перцептроны , а два параметра — это обучаемые синаптические веса. РН дифференцируемы. Результатом gθ является «отношение»; следовательно, роль gθ состоит в том, чтобы сделать вывод о том, каким образом два объекта связаны. [1]
Обработка изображения (128x128 пикселей) выполняется с помощью 4-слойной CNN. Выходные данные CNN рассматриваются как объекты для анализа отношений, без учета того, что явно представляют эти «объекты». Вопросы обрабатывались с помощью длинной кратковременной памяти . [1]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д и Санторо, Адам; Рапозо, Дэвид; Барретт, Дэвид Г.Т.; Малиновский, Матеуш; Пашкану, Разван; Батталья, Питер; Лилликрап, Тимоти (5 июня 2017 г.). «Простой модуль нейронной сети для реляционных рассуждений». arXiv : 1706.01427 [ cs.CL ].