Был
Оригинальный автор(ы) | Уильям Гулд [1] |
---|---|
Разработчик(и) | СтатаКорп |
Первоначальный выпуск | 1985 |
Стабильная версия | 18,0
/ 25 апреля 2023 г |
Написано в | С |
Операционная система | Windows , macOS , Linux |
Тип | Статистический анализ Численный анализ |
Лицензия | Собственный |
Веб-сайт | www |
Стата ( / ˈsteɪtə teɪtə / , [2] STAY -ta , альтернативно / ˈ s t æ t ə / , иногда стилизованный как STATA [3] [4] программного обеспечения общего назначения, ) — пакет статистического разработанный StataCorp для обработки данных, визуализации, статистики и автоматизированной отчетности. Он используется исследователями во многих областях, включая биомедицину , экономику , эпидемиологию и социологию . [5]
Первоначально Stata была разработана Центром вычислительных ресурсов в Калифорнии, а первая версия была выпущена в 1985 году. [6] В 1993 году компания переехала в Колледж-Стейшн, штат Техас, и была переименована в Stata Corporation, теперь известную как StataCorp. [1] Основной выпуск 2003 года включал новую графическую систему и диалоговые окна для всех команд. [6] С тех пор новая версия выпускается раз в два года. [7] Текущая версия — Stata 18, выпущенная в апреле 2023 года. [8]
Технический обзор и терминология
[ редактировать ]Пользовательский интерфейс
[ редактировать ]С момента своего создания Stata всегда использовала интегрированный интерфейс командной строки. Начиная с версии 8.0, Stata включает графический интерфейс пользователя , который использует меню и диалоговые окна для доступа ко многим встроенным командам. Набор данных можно просматривать или редактировать в формате электронной таблицы. Начиная с версии 11, другие команды можно выполнять, пока открыт браузер или редактор данных.
Структура и хранение данных
[ редактировать ]До выхода версии 16, [9] открыть только один набор данных Stata могла одновременно . Stata обеспечивает гибкость при назначении типов данных. Его compress
Команда автоматически переназначает данные типам данных, которые занимают меньше памяти, без потери информации. по умолчанию используется одинарная точность (4 байта), а не двойная точность (8 байтов) Stata использует целочисленные типы хранения, которые занимают только один или два байта, а не четыре, а для чисел с плавающей запятой .
Формат данных Stata всегда табличный . Stata называет столбцы табличных данных переменными.
Совместимость форматов данных
[ редактировать ]Stata может импортировать данные в различных форматах. Сюда входят форматы данных ASCII (например, CSV или форматы банков данных ) и форматы электронных таблиц (включая различные форматы Excel ).
Stata Собственные форматы файлов со временем изменились, хотя не каждая версия Stata включает новый формат набора данных. Каждая версия Stata может читать все старые форматы наборов данных и записывать как текущий, так и самый последний предыдущий формат набора данных, используя saveold
команда. [10] Таким образом, текущая версия Stata всегда может открывать наборы данных, созданные в более старых версиях, но более старые версии не могут читать наборы данных нового формата.
Stata может читать и записывать наборы данных в формате SAS XPORT, используя команды fdause и fdasave .
Некоторые другие эконометрические приложения, включая gretl , могут напрямую импортировать форматы файлов Stata.
История
[ редактировать ]Происхождение
[ редактировать ]Разработка Stata началась в 1984 году сначала Уильямом (Биллом) Гулдом, а затем Шоном Беккетти. Программное обеспечение изначально предназначалось для конкуренции со статистическими программами для персональных компьютеров, такими как SYSTAT и MicroTSP . [6] Stata была написана тогда, как и сейчас, на языке программирования C , первоначально для ПК под управлением операционной системы DOS . Первая версия была выпущена в 1985 году и содержала 44 команды. [6]
добавить | ты | инфиль | сюжет | катушка |
звуковой сигнал | делать | вход | запрос | подвести итог |
к | уронить | этикетка | регресс | сводить в таблицы |
захватывать | стереть | список | переименовывать | тест |
подтверждать | Выход | макрос | заменять | тип |
конвертировать | расширять | слить | бегать | использовать |
коррелировать | формат | изменить | сохранять | |
считать | генерировать | более | набор | |
описывать | помощь | исходный файл | сортировать |
Разработка
[ редактировать ]В период с 1985 по 2021 год было выпущено 17 основных выпусков Stata, а также дополнительные обновления кода и документации между основными выпусками. [7] В первые годы своего существования дополнительные наборы программ Stata иногда продавались как «наборы» или распространялись как диски поддержки. С выпуском Stata 6 в 1999 году update
s начали доставляться пользователям через Интернет. [6] Первоначальный выпуск Stata был для операционной системы DOS . С тех пор были выпущены версии Stata для систем, работающих под управлением Unix вариантов Linux , таких как дистрибутивы , Windows и MacOS . [6] Все файлы Stata не зависят от платформы.
За 37-летнюю историю Stata были добавлены сотни команд. [11] [12] Некоторые разработки оказались особенно важными и продолжают формировать пользовательский опыт сегодня, включая расширяемость , независимость от платформы и активное сообщество пользователей . [6]
Расширяемость
[ редактировать ]The program
Команда была реализована в Stata 1.2, что дало пользователям возможность добавлять свои собственные команды. [6] [13] В Stata 2.1 последовали файлы ado, позволяющие автоматически загружать написанную пользователем программу в память. Многие написанные пользователями ADO-файлы передаются в Архив компонентов статистического программного обеспечения, размещенный в Бостонском колледже. StataCorp добавила ssc
Команда, позволяющая добавлять программы, созданные сообществом, непосредственно в Stata. [14] Более поздние выпуски Stata позволяют пользователям вызывать сценарии Python с помощью команд, а также позволяют средам разработки Python, таким как Jupyter Notebooks, импортировать команды Stata. [15] Хотя Stata изначально не поддерживает R, существуют написанные пользователем расширения для использования сценариев R в Stata. [16]
Сообщество пользователей
[ редактировать ]Ряд важных разработок был инициирован активным сообществом пользователей Stata. [6] , Технический бюллетень Stata который часто содержит команды, созданные пользователями, был представлен в 1991 году и выпускался шесть раз в год. Он был перезапущен в 2001 году как рецензируемый журнал Stata Journal , ежеквартальное издание, содержащее описания команд, предоставленных сообществом, и советы по эффективному использованию Stata. В 1994 году рассылка зародилась как центр, где пользователи могли совместно решать программные и технические проблемы; в 2014 году он был преобразован в веб-форум. В 1995 году Statacorp начала организовывать конференции пользователей и разработчиков, которые проводятся ежегодно. Только ежегодная конференция Stata, проводимая в Соединенных Штатах, проводится StataCorp. Другие встречи групп пользователей проводятся ежегодно в США (Stata Conference), Великобритании, Германии и Италии, а также реже в ряде других стран. Местные дистрибьюторы Stata проводят встречи групп пользователей в своих странах.
Программные продукты
[ редактировать ]Существует четыре сборки Stata: Stata/MP, Stata/SE, Stata/BE и Numerics от Stata. [17] В то время как Stata/MP допускает встроенную параллельную обработку определенных команд, Stata/SE и Stata/BE имеют узкие места и ограничивают использование только одним ядром. [18] Stata/MP выполняет определенные команды примерно в 2,4 раза быстрее, что составляет примерно 60% от теоретической максимальной эффективности, при запуске параллельных процессов на четырех ядрах ЦП по сравнению с версиями SE или BE. [18] Numerics от Stata позволяет веб-интеграцию команд Stata.
Версии SE и BE различаются объемом памяти, которую могут использовать наборы данных. Хотя Stata/MP может хранить от 10 до 20 миллиардов наблюдений и до 120 000 переменных, Stata/SE и Stata/BE хранят до 2,14 миллиардов наблюдений и обрабатывают 32 767 переменных и 2048 переменных соответственно. Максимальное количество независимых переменных в модели составляет 65 532 переменных в Stata/MP, 10 998 переменных в Stata/SE и 798 переменных в Stata/BE. [17]
Цены и лицензирование Stata зависят от его предполагаемого использования: бизнес, правительство/некоммерческая организация, образование или обучение. Однопользовательские лицензии можно продлевать ежегодно или бессрочно. Другие типы лицензий включают одиночную лицензию для одновременного использования пользователями, лицензию для сайта, корпоративную лицензию для одного пользователя для оптовых цен или студенческую лабораторию. [19]
Пример кода
[ редактировать ]Следующий набор команд посвящен простому управлению данными. [20]
sysuse auto // Open the included auto dataset
browse // Browse the dataset (opens the Data Editor window)
describe // Describes the dataset and associated variables
summarize // Summary information about numerical variables
codebook make foreign // Summary information about the make (string) and foreign (numeric) variables
browse if missing(rep78) // Browse only observations with missing data for variable rep78
list make if missing(rep78) // List makes of the cars with missing data for variable rep78
Следующий набор команд переходит к описательной статистике.
summarize price, detail // Detailed summary statistics for variable price
tabulate foreign // One-way frequency table for variable foreign
tabulate rep78 foreign, row // Two-way frequency table for variables rep78 and foreign
summarize mpg if foreign == 1 // Summary information about mpg if the car is foreign (the "==" sign tests for equality)
by foreign, sort: summarize mpg // As above, but using the "by" prefix.
tabulate foreign, summarize(mpg) // As above, but using the tabulate command.
Простой тест гипотезы:
ttest mpg, by(foreign) // T-test for difference in means for domestic vs. foreign cars
Графические данные:
twoway (scatter mpg weight) // Scatter plot showing relationship between mpg and weight
twoway (scatter mpg weight), by(foreign, total) // Three graphs for domestic, foreign, and all cars
Линейная регрессия:
generate wtsq = weight^2 // Create a new variable for weight squared
regress mpg weight wtsq foreign, vce(robust) // Linear regression of mpg on weight, wtsq, and foreign
predict mpghat // Create a new variable contained the predicted values of mpg
twoway (scatter mpg weight) (line mpghat weight, sort), by(foreign) // Graph data and fitted line
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Ньютон, Х. Джозеф (2005). «Разговор с Уильямом Гулдом» . Стата-журнал . 5 (1): 19–31. дои : 10.1177/1536867X0500500103 . S2CID 118322998 .
- ^ Кокс, Николас Дж. «Часто задаваемые вопросы по статистике» . Статалист: Стата Форум . Проверено 24 апреля 2021 г.
- ^ «Манипулирование данными STATA: основы и приложения 7» (PDF) . Iuj.ac.jp. Проверено 27 января 2022 г.
- ^ Суарес, Эрик; Перес, Синтия; Ногерас, Грасиела; Морено-Горрин, Камилла (2016). биостатистика в общественном здравоохранении с использованием статистики .
- ^ «Дисциплины» . Stata: Программное обеспечение для статистики и обработки данных . Проверено 21 апреля 2021 г.
- ^ Перейти обратно: а б с д и ж г час я Кокс, Николас Дж. (2005). «Краткая история Stata к 20-летию» . Стата-журнал . 5 (1): 2–18. дои : 10.1177/1536867X0500500102 . S2CID 118366843 . Проверено 22 апреля 2021 г.
- ^ Перейти обратно: а б Гулд, Уильям В.; Кокс, Николас Дж. «Когда была впервые выпущена Stata? Когда были выпущены более поздние версии?» . Stata: Программное обеспечение для статистики и обработки данных . Проверено 22 апреля 2021 г.
- ^ «Что нового в Стате?» . Stata: Программное обеспечение для статистики и обработки данных . СтатаКорп . Проверено 25 апреля 2023 г.
- ^ «Кадры данных: несколько наборов данных в памяти» . Стата.com . Проверено 13 августа 2020 г.
- ^ «Stata 16 поможет сохраниться» . Стата.com .
- ^ Глоссарий и указатель Stata: выпуск 17 (PDF) . Колледж-Стейшн, Техас: Stata Press. стр. 1–50. ISBN 1-59718-283-4 .
- ^ «Особенности Статы» . Stata: Программное обеспечение для статистики и обработки данных . СтатаКорп . Проверено 24 апреля 2021 г.
- ^ «Программа — определение программ и управление ими» (PDF) . Stata: Программное обеспечение для статистики и обработки данных . Стата Пресс . Проверено 24 апреля 2021 г.
- ^ «ssc — установка и удаление пакетов из SSC» (PDF) . Stata: Программное обеспечение для статистики и обработки данных . Стата Пресс . Проверено 24 апреля 2021 г.
- ^ «Используйте Python и Stata вместе | Stata» .
- ^ «Как постепенно переключить рабочий процесс со Stata на R · Фредерик Солт» . Fsolt.org . Проверено 27 января 2022 г.
- ^ Перейти обратно: а б «Какая Стата мне подходит?» . Stata: Программное обеспечение для статистики и обработки данных . Проверено 23 апреля 2021 г.
- ^ Перейти обратно: а б «Параллельная Стата» . Гарвардская школа бизнеса.
- ^ «Заказать программное обеспечение Stata» . Stata: Программное обеспечение для статистики и обработки данных . СтатаКорп . Проверено 25 апреля 2021 г.
- ^ Начало работы с Stata для Windows (PDF) (выпуск 17-е изд.). Колледж-Стейшн, Техас: Stata Press. стр. 1–19. ISBN 1-59718-334-2 . Проверено 25 апреля 2021 г.
Дальнейшее чтение
[ редактировать ]- Биттманн, Феликс (2019). Stata — действительно краткое введение . Бостон: ДеГрютер Ольденбург. ISBN 978-3-11061-729-0 .
- Пинзон, Генри, изд. (2015). Тридцать лет со Stata: ретроспектива . Колледж-Стейшн, Техас: Stata Press. ISBN 978-1-59718-172-3 .
- Гамильтон, Лоуренс К. (2013). Статистика со STATA . Бостон: Сенгадж. ISBN 978-0-84006-463-9 .
Внешние ссылки
[ редактировать ]- программное обеспечение 1985 года
- Собственное программное обеспечение, написанное на языке C.
- Проприетарное коммерческое программное обеспечение для Linux.
- Научное программное обеспечение для Linux
- Программное обеспечение для интеллектуального анализа данных и машинного обучения
- Статистическое программное обеспечение
- Статистические языки программирования
- Программное обеспечение для эконометрики
- Программное обеспечение временных рядов
- Хранилище данных
- Собственное кроссплатформенное программное обеспечение.
- Извлечение, преобразование, загрузка инструментов
- Программное обеспечение для математической оптимизации
- Числовое программное обеспечение