SCIgen
Репозиторий | |
---|---|
Написано в | Перл |
Доступно в | Английский |
Тип | Генератор бумаги |
Лицензия | Стандартная общественная лицензия GNU |
Веб-сайт | http://pdos.csail.mit.edu/scigen/ |
SCIgen — это генератор статей , который использует контекстно-свободную грамматику для случайной генерации бессмыслицы в виде по информатике научных статей . Его первоначальным источником данных была коллекция статей по информатике, загруженная с CiteSeer . Оформлены все элементы статей, включая графики, диаграммы и цитаты . Созданная учеными Массачусетского технологического института , ее заявленная цель — «максимизировать развлечение, а не последовательность». [1] Первоначально созданный в 2005 году для выявления недостаточной проверки материалов, представленных на конференциях, генератор впоследствии стал использоваться, в первую очередь китайскими учеными, для создания большого количества мошеннических материалов для конференций, что привело к отзыву 122 статей, созданных SCIgen, и созданию программного обеспечения для обнаружения. для борьбы с его использованием. [2]
Пример вывода
[ редактировать ]Вступительная часть книги Rooter: Методология типичной унификации точек доступа и резервирования : [3]
Многие физики согласились бы, что, если бы не контроль перегрузок, оценка веб-браузеров, возможно, никогда бы не состоялась. Фактически, немногие хакеры во всем мире не согласятся с существенным объединением передачи голоса по IP и пары открытого/закрытого ключей. Чтобы решить эту загадку, мы подтверждаем, что SMP можно сделать стохастическим, кэшируемым и вставным.
Выдающиеся результаты
[ редактировать ], созданная SCIgen В 2005 году статья Rooter: A Methodology for the типичной унификации точек доступа и избыточности , была принята как нерецензируемая на Всемирной мультиконференции по системике, кибернетике и информатике (WMSCI) 2005 года, и авторы были приглашены. говорить. Авторы SCIgen описали свою мистификацию на своем сайте, и вскоре она получила широкую огласку, когда ее подхватил Slashdot . WMSCI отозвал свое приглашение, но команда SCIgen все равно поехала, арендовав место в отеле отдельно от конференции и проведя серию случайно сгенерированных докладов по своему «дорожке». Организатором конференций WMSCI является профессор Нагиб Каллаос. С 2000 по 2005 год WMSCI также спонсировался Институтом инженеров по электротехнике и электронике . [4] IEEE прекратил оказывать спонсорскую поддержку Кальяосу с 2006 по 2008 год.
Подача статьи была преднамеренной попыткой поставить в неловкое положение WMSCI, который, как утверждают авторы, принимает статьи низкого качества и рассылает ученым нежелательные запросы на представление статей. Как говорится на сайте SCIgen:
Одной из полезных целей такой программы является автоматическое создание материалов для конференций, которые, как вы подозреваете, могут иметь очень низкие стандарты подачи. Ярким примером, который вы можете узнать по спаму в вашем почтовом ящике, является SCI/IIIS и десятки проводимых рядом конференций (см. очень подробное описание конференции на веб-сайте WMSCI 2005).
— О SCIgen [5]
Писатель по вычислительной технике Стэн Келли-Бутл отметил в ACM Queue , что многие предложения в статье «Rooter» были правдоподобны по отдельности, что, по его мнению, создавало проблему для автоматического обнаружения статей-мистификаций. Он предположил, что даже читатели-люди могут быть обмануты эффективным использованием жаргона («Игра слов на тему root/router является нормой для юмора выпускников Массачусетского технологического института, и по крайней мере одно упоминание методологии является обязательным») и приписал очевидную бессвязность статьи свои ограниченные знания. Его вывод заключался в том, что «надежный фильтр тарабарщины требует тщательного комплексного анализа несколькими экспертами в одной области». [6]
Змея человек
[ редактировать ]Псевдоним практикуют «Герберт Шлангеманн» использовался для публикации фейковых научных статей на международных конференциях, которые утверждали, что рецензирование . Название взято из шведского короткометражного фильма Der Schlangemann .
- В 2008 году в ответ на серию с запросами на бумагу электронных писем SCIgen был использован для создания фальшивой научной статьи под названием «На пути к моделированию электронной коммерции » с использованием «Герберта Шлангемана» в качестве автора. Статья была принята на Международной конференции по информатике и программной инженерии (CSSE 2008) 2008 года , спонсируемой IEEE , которая должна была состояться в Ухане, Китай , а автор был приглашен председательствовать на сессии на основании своего вымышленного творчества. Резюме . [7] Официальный комментарий обзора: «В этой статье представлены кооперативная технология и классическая коммуникация. В заключение, результат показывает, что, хотя широко разрекламированный амфибийный алгоритм для уточнения рандомизированных алгоритмов невозможен, хорошо известный алгоритм клиент-сервер для анализа передача голоса по IP Кумара и Рамана выполняется за _(n) время. Авторы могут четко определить важные особенности визуализации DHT и глубоко их проанализировать. Авторам рекомендуется более убедительно разрабатывать идеи, организовывать их более логично. и соединяет их четкими переходами». Статья некоторое время была доступна в базе данных IEEE Xplore, но затем была удалена. Вся история описана в официальном блоге «Герберта Шлангемана» , [8] и это также привлекло внимание на Slashdot [9] и немецкоязычный сайт новостей о технологиях Heise Online. [10] [11]
- В 2009 году произошел тот же инцидент, и последняя фальшивая статья Герберта Шлангемана PlusPug: Методология улучшения локальных сетей была принята для устного доклада на Международной конференции 2009 года по электронному бизнесу и безопасности информационных систем (EBISS 2009) , также соавторствующей в 2009 году. -спонсируемый IEEE , который снова пройдет в Ухане, Китай . [8]
Во всех случаях опубликованные доклады были изъяты из сборников конференций, а оргкомитет конференции и имена основных докладчиков были удалены с их сайтов.
Список работ, получивших заметное признание
[ редактировать ]На конференциях
[ редактировать ]- Роб Томас: Rooter: Методология типичной унификации точек доступа и резервирования , 2005 г. для WMSCI (см. выше)
- Доклад Матиаса Услара был принят на конференцию IPSI-BG. [12]
- Профессор Дженко Гулан опубликовал доклад на 3-м Международном симпозиуме по интерактивному медиа-дизайну. [13]
- документ 2013 года Научно-метрический опубликовали не менее 85 статей SCIgen показал, что IEEE и Springer . [14] Согласно этому исследованию, более 120 статей SCIgen были удалены. [15]
В журналах
[ редактировать ]- Студенты иранского Технологического университета Шарифа опубликовали статью в журнале Elsevier 's Journal of Applied Mathematics and Computation . [16] Студенты писали под фамилией «Мосалла Нежад», что буквально переводится с персидского языка (несмотря на то, что это не традиционное персидское имя ) как «из вооруженной породы». Впоследствии газета была удалена, когда издателям сообщили, что это шуточная статья. [17]
- Михаил Гельфанд опубликовал перевод статьи «Рутер» в русскоязычном «Журнале научных публикаций аспирантов и докторантов» в августе 2008 года. Гельфанд протестовал против журнала, который, видимо, не рецензировался и использовался российскими кандидатами наук для опубликоваться в « аккредитованном » научном журнале, взяв за это 4000 рублей. Через две недели аккредитация была отозвана. [18] [19] [20] [21] (Соответствующую информацию см. в «Диссернете» .)
- Springer Science+Business Media и IEEE также стали объектом подобных розыгрышей.
Подмена Google Scholar и Хирша калькуляторов индекса
[ редактировать ]Судейство, проводимое от имени Института инженеров по электротехнике и электронике, также подверглось критике после того, как в публикациях конференции были обнаружены фальшивые статьи, в первую очередь Лаббе и исследователем, использовавшим псевдоним Шлангеманн . [22] [23] [24] [25] [26] [27]
Сирил Лаббе из Университета Гренобля продемонстрировал уязвимость Хирша вычислений индекса на основе результатов Google Scholar , предоставив ему большой набор сгенерированных SCIgen документов, которые цитировали друг друга (по сути, академическую ферму ссылок) , в статье 2010 года. Используя этот метод, автору удалось поставить «Айка Анткара» выше, Альберта Эйнштейна . например, [28]
Отзыв 2013 г.
[ редактировать ]отозвали более 122 опубликованных статей на конференциях, созданных SCIgen В 2013 году Springer и IEEE . В отличие от предыдущих материалов, которые были задуманы как розыгрыши, это сообщение было в основном подано китайскими учеными, которые использовали статьи SCIgen, чтобы повысить свой рейтинг публикаций. [29]
СайДетект
[ редактировать ]выпустила SciDetect В 2015 году компания Springer . Это программное обеспечение, разработанное Сирилом Лаббе, предназначено для автоматического обнаружения документов, созданных SCIgen. [2]
отчет за 2021 год
[ редактировать ]В 2021 году было опубликовано исследование 243 статей SCIgen, опубликованных в научной литературе. Они обнаружили, что статьи SCIgen составляют 75 на миллион статей (< 0,01%) в области информатики, и что только небольшая часть обнаруженных статей была обработана. [30] [31]
См. также
[ редактировать ]- Научная конференция
- Bogdanov Affair
- Крушение (расстройство мышления)
- Дело о рассмотрении жалоб
- Теорема о бесконечных обезьянах
- Список мистификаций научных публикаций
- Генератор бумаги
- Генератор пародий
- Генератор постмодернизма
- Сокальское дело
- Двигатель
- Тест Тьюринга
- Убери меня из своего гребаного списка рассылки.
- Кто боится экспертной оценки?
Ссылки
[ редактировать ]- ^ SCIgen - Автоматический генератор бумаги CS
- ^ Jump up to: Перейти обратно: а б Боханнон, Джон (27 марта 2015 г.). «Программное обеспечение для обнаружения мистификаций обнаруживает поддельные документы» . Наука | АААС . Проверено 28 сентября 2020 г.
Похоже, что многие фальшивые статьи были созданы не для розыгрыша, а из Китая, где их «покупали ученые и студенты», чтобы пополнить свои записи о публикациях, говорит ведущий исследователь расследования Сирил Лаббе, ученый-компьютерщик из Университет Жозефа Фурье в Гренобле, Франция.
- ^ Стриблинг, Джереми; Агуайо, Дэниел; Крон, Максвелл. «Rooter: методология типичной унификации точек доступа и резервирования» (PDF) .
- ^ Генрих Занкль: Генератор науки — гениальная программа публикаций . В. Хёмберг, Э. Ролофф (редактор): Ежегодник маржиналистики IV: Лит-Верлаг. Мюнстер. 2016, стр. 60–67. ISBN 978-3-643-99793-7
- ^ «SCIgen — автоматический генератор CS-бумаги» . Массачусетский технологический институт.
- ^ Стэн Келли-Бутл (июль – август 2005 г.). «Назовите это тарабарщиной?» . Очередь АКМ . 3 (6): 64. дои : 10.1145/1080862.1080884 .
- ^ «Программа конференции CSSE» (PDF) .
- ^ Jump up to: Перейти обратно: а б «Официальный блог Герберта Шлангемана, вся история статьи «К моделированию электронной коммерции» » .
- ^ Кдоусон (24 декабря 2008 г.). «Работа, созданная программным обеспечением, принята на конференции IEEE» . Слэшдот . VA Linux Systems Япония . Проверено 5 мая 2009 г.
- ^ Питер-Майкл Зиглер (26 декабря 2008 г.). «Доктор Герберт Снакеманн - или история псевдонаучной бессмысленной статьи (на немецком языке)» . Хейзе онлайн . Издательство журнала Heise . Проверено 5 мая 2009 г.
- ^ Веб-страница Heise Online (на немецком языке)
- ^ «Доклад Матиаса Услара» . Архивировано из оригинала 15 июня 2009 г.
- ^ «О статье Генко Гулана» .
- ^ «Дубликаты и фейковые публикации в научной литературе: сколько статей SCIgen по информатике?» (PDF) . Hal.archives-ouvertes.fr . Проверено 15 мая 2014 г.
- ^ «Издатели отзывают более 120 тарабарщин» . Природа . 24 февраля 2014 года . Проверено 25 февраля 2014 г.
- ^ Рохолла Мосаллахнежад. «Кооперативные компактные алгоритмы для рандомизированных алгоритмов» (PDF) . Архивировано из оригинала (PDF) 29 декабря 2009 г.
- ^ Рохолла Мосаллахнежад (2007), «УДАЛЕНО: Кооперативные компактные алгоритмы для рандомизированных алгоритмов», Прикладная математика и вычисления , doi : 10.1016/j.amc.2007.03.011
- ^ «Мой компьютер пишет лучше твоего!» . Agence Science-Presse (на французском языке). Канада. 8 сентября 2009 года . Проверено 4 октября 2011 г.
- ^ «Рутер вторгается в Россию» . SCIген . 8 января 2009 года . Проверено 4 октября 2011 г.
- ^ Малоземов, Сергей (7 октября 2008 г.). Группа отечественных ученых поставила эксперимент — смешала сложные термины случайным образом, а полученный текст отослала в один из научных журналов . НТВ (на русском языке) . Проверено 4 октября 2011 г.
- ^ "Обратная связь". Новый учёный . 15 августа 2009 г.
- ^ Лаббе, Сирил; Лаббе, Доминик (2013). «Дубликаты и фейковые публикации в научной литературе: сколько статей SCIgen по информатике?» . Наукометрия . 94 (1): 379–396. дои : 10.1007/s11192-012-0781-y . S2CID 6889400 .
- ^ Оранский Иван (24 февраля 2014 г.). «Спрингер, IEEE отзывает более 120 бессмысленных статей» . retractionwatch.com . WordPress.com . Проверено 29 апреля 2014 г.
- ^ де Глостер, Пол Колин (2013). «Рецензенты часто упускают из виду очевидные ошибки в компьютерных и электронных публикациях» . Подотчетность в исследованиях: политика и обеспечение качества . 20 (3): 143–166. Бибкод : 2013ARPQ...20..143D . дои : 10.1080/08989621.2013.788379 . ПМИД 23672521 . S2CID 42975675 .
- ^ Доусон, К. (23 декабря 2008 г.). «Работа, созданная программным обеспечением, принята на конференции IEEE» . slashdot.org . Кости . Проверено 29 апреля 2014 г.
- ^ 24 декабря 2008 г.). IEEE принимает автоматически созданный . » фальшивый Хатта, Масаюки ( документ « Конференция
- ^ Зиглер, Питер-Майкл (26 декабря 2008 г.). «Доктор Герберт Снейкманн – или история псевдонаучной бессмысленной статьи» . heise.de (на немецком языке). Издательство журнала Heise . Проверено 29 апреля 2014 г.
- ^ «Отчеты об исследованиях LIG» (PDF) . Rr.liglab.fr . Проверено 15 мая 2014 г.
- ^ Ван Ноорден, Ричард (2014). «Издатели отзывают более 120 тарабарщин» . Новости природы . дои : 10.1038/nature.2014.14763 .
- ^ Кабанак, Гийом; Лаббе, Сирил (25 мая 2021 г.). «Распространенность бессмысленных алгоритмически сгенерированных статей в научной литературе» . Журнал Ассоциации информационных наук и технологий . 72 (12): 1461–1476. дои : 10.1002/asi.24495 . ISSN 2330-1635 . S2CID 236374033 .
- ^ Ноорден, Ричард Ван (27 мая 2021 г.). «В научной литературе до сих пор скрываются сотни бессмысленных статей» . Природа . 594 (7862): 160–161. Бибкод : 2021Природа.594..160В . дои : 10.1038/d41586-021-01436-7 . ПМИД 34045760 . S2CID 235232305 .
Дальнейшее чтение
[ редактировать ]- Болл, Филип (2005). «Компьютерная конференция приветствует чушь» . Природа . 434 (7036): 946. Бибкод : 2005Natur.434..946B . дои : 10.1038/nature03653 . ПМИД 15846311 .
- Кдоусон (24 декабря 2008 г.). «Работа, созданная программным обеспечением, принята на конференции IEEE» . Слэшдот . VA Linux Systems Япония . Проверено 5 мая 2009 г.
- Питер-Майкл Зиглер (26 декабря 2008 г.). «Доктор Герберт Снакеманн - или история псевдонаучной бессмысленной статьи (на немецком языке)» . Хейзе онлайн . Издательство журнала Heise . Проверено 5 мая 2009 г.