Jump to content

Был

(Перенаправлено со СТАТА )
Был
Оригинальный автор(ы) Уильям Гулд [1]
Разработчик(и) СтатаКорп
Первоначальный выпуск 1985  ( 1985 )
Стабильная версия
18,0 / 25 апреля 2023 г .; 15 месяцев назад ( 25 апреля 2023 )
Написано в С
Операционная система Windows , macOS , Linux
Тип Статистический анализ
Численный анализ
Лицензия Собственный
Веб-сайт www .был

Стата ( / ˈsteɪtə ttə / , [2] STAY -ta , альтернативно / ˈ s t æ t ə / , иногда стилизованный как STATA [3] [4] программного обеспечения общего назначения, ) — пакет статистического разработанный StataCorp для обработки данных, визуализации, статистики и автоматизированной отчетности. Он используется исследователями во многих областях, включая биомедицину , экономику , эпидемиологию и социологию . [5]

Первоначально Stata была разработана Центром вычислительных ресурсов в Калифорнии, а первая версия была выпущена в 1985 году. [6] В 1993 году компания переехала в Колледж-Стейшн, штат Техас, и была переименована в Stata Corporation, теперь известную как StataCorp. [1] Основной выпуск 2003 года включал новую графическую систему и диалоговые окна для всех команд. [6] С тех пор новая версия выпускается раз в два года. [7] Текущая версия — Stata 18, выпущенная в апреле 2023 года. [8]

Технический обзор и терминология

[ редактировать ]

Пользовательский интерфейс

[ редактировать ]

С момента своего создания Stata всегда использовала интегрированный интерфейс командной строки. Начиная с версии 8.0, Stata включает графический интерфейс пользователя , который использует меню и диалоговые окна для доступа ко многим встроенным командам. Набор данных можно просматривать или редактировать в формате электронной таблицы. Начиная с версии 11, другие команды можно выполнять, пока открыт браузер или редактор данных.

Структура и хранение данных

[ редактировать ]

До выхода версии 16, [9] открыть только один набор данных Stata могла одновременно . Stata обеспечивает гибкость при назначении типов данных. Его compress Команда автоматически переназначает данные типам данных, которые занимают меньше памяти, без потери информации. по умолчанию используется одинарная точность (4 байта), а не двойная точность (8 байтов) Stata использует целочисленные типы хранения, которые занимают только один или два байта, а не четыре, а для чисел с плавающей запятой .

Формат данных Stata всегда табличный . Stata называет столбцы табличных данных переменными.

Совместимость форматов данных

[ редактировать ]

Stata может импортировать данные в различных форматах. Сюда входят форматы данных ASCII (например, CSV или форматы банков данных ) и форматы электронных таблиц (включая различные форматы Excel ).

Stata Собственные форматы файлов со временем изменились, хотя не каждая версия Stata включает новый формат набора данных. Каждая версия Stata может читать все старые форматы наборов данных и записывать как текущий, так и самый последний предыдущий формат набора данных, используя saveold команда. [10] Таким образом, текущая версия Stata всегда может открывать наборы данных, созданные в более старых версиях, но более старые версии не могут читать наборы данных нового формата.

Stata может читать и записывать наборы данных в формате SAS XPORT, используя команды fdause и fdasave .

Некоторые другие эконометрические приложения, включая gretl , могут напрямую импортировать форматы файлов Stata.

Происхождение

[ редактировать ]

Разработка Stata началась в 1984 году сначала Уильямом (Биллом) Гулдом, а затем Шоном Беккетти. Программное обеспечение изначально предназначалось для конкуренции со статистическими программами для персональных компьютеров, такими как SYSTAT и MicroTSP . [6] Stata была написана тогда, как и сейчас, на языке программирования C , первоначально для ПК под управлением операционной системы DOS . Первая версия была выпущена в 1985 году и содержала 44 команды. [6]

Команды в Stata 1.0 и Stata 1.1
добавить ты инфиль сюжет катушка
звуковой сигнал делать вход запрос подвести итог
к уронить этикетка регресс сводить в таблицы
захватывать стереть список переименовывать тест
подтверждать Выход макрос заменять тип
конвертировать расширять слить бегать использовать
коррелировать формат изменить сохранять
считать генерировать более набор
описывать помощь исходный файл сортировать

Разработка

[ редактировать ]

В период с 1985 по 2021 год было выпущено 17 основных выпусков Stata, а также дополнительные обновления кода и документации между основными выпусками. [7] В первые годы своего существования дополнительные наборы программ Stata иногда продавались как «наборы» или распространялись как диски поддержки. С выпуском Stata 6 в 1999 году updates начали доставляться пользователям через Интернет. [6] Первоначальный выпуск Stata был для операционной системы DOS . С тех пор были выпущены версии Stata для систем, работающих под управлением Unix вариантов Linux , таких как дистрибутивы , Windows и MacOS . [6] Все файлы Stata не зависят от платформы.

За 37-летнюю историю Stata были добавлены сотни команд. [11] [12] Некоторые разработки оказались особенно важными и продолжают формировать пользовательский опыт сегодня, включая расширяемость , независимость от платформы и активное сообщество пользователей . [6]

Расширяемость

[ редактировать ]

The program Команда была реализована в Stata 1.2, что дало пользователям возможность добавлять свои собственные команды. [6] [13] В Stata 2.1 последовали файлы ado, позволяющие автоматически загружать написанную пользователем программу в память. Многие написанные пользователями ADO-файлы передаются в Архив компонентов статистического программного обеспечения, размещенный в Бостонском колледже. StataCorp добавила ssc Команда, позволяющая добавлять программы, созданные сообществом, непосредственно в Stata. [14] Более поздние выпуски Stata позволяют пользователям вызывать сценарии Python с помощью команд, а также позволяют средам разработки Python, таким как Jupyter Notebooks, импортировать команды Stata. [15] Хотя Stata изначально не поддерживает R, существуют написанные пользователем расширения для использования сценариев R в Stata. [16]

Сообщество пользователей

[ редактировать ]

Ряд важных разработок был инициирован активным сообществом пользователей Stata. [6] , Технический бюллетень Stata который часто содержит команды, созданные пользователями, был представлен в 1991 году и выпускался шесть раз в год. Он был перезапущен в 2001 году как рецензируемый журнал Stata Journal , ежеквартальное издание, содержащее описания команд, предоставленных сообществом, и советы по эффективному использованию Stata. В 1994 году рассылка зародилась как центр, где пользователи могли совместно решать программные и технические проблемы; в 2014 году он был преобразован в веб-форум. В 1995 году Statacorp начала организовывать конференции пользователей и разработчиков, которые проводятся ежегодно. Только ежегодная конференция Stata, проводимая в Соединенных Штатах, проводится StataCorp. Другие встречи групп пользователей проводятся ежегодно в США (Stata Conference), Великобритании, Германии и Италии, а также реже в ряде других стран. Местные дистрибьюторы Stata проводят встречи групп пользователей в своих странах.

Таблица: Релизы и развитие Stata
Version Release date Select new or enhanced features
1.0 January 1985
  • Initial release
  • Forty-four commands
1.1 February 1985
  • Bug fixes
1.2 May 1985
  • New menu system
  • Better online help
  • keep
1.3 August 1985
  • Stata/Graphics
  • program
1.4 August 1986
  • New documentation
  • Formatted infile
1.5 February 1987
  • anova
  • logit, probit
2.0 June 1988
  • New graphics
  • String variables
  • Survival analysis: Cox and Kaplan-Meier
  • Stepwise regression
2.1 September 1990
  • Byte variables
  • Factor analysis
  • ado-files
  • reshape
3.0 March 1992
  • logistic, ologit, oprobit, clogit, mlogit
  • tobit, cnreg, rreg, qreg, weibull, ereg
  • epitab
  • pweights
3.1 August 1993
  • mvreg, sureg, heckman, nlreg, areg, canon
  • nbreg
  • constrained linear regression
  • ml
  • codebook
4.0 January 1995
  • xtreg
  • glm
5.0 October 1996
  • xtgee, xtprobit
  • prais, newey, intreg
  • survey estimation commands
  • fracpoly
  • st extended
6.0 January 1999
  • web aware
  • new ml
  • time-series operators
  • arima, arch
  • st rewritten
7.0 December 2000
  • frailty
  • xtabond
  • cluster analysis
  • nlogit
  • roc
  • SMCL
8.0 January 2003
  • graphics
  • extended GUI, dialog boxes available for all commands
  • manova
  • more survey
  • more time series (VARs, SVARs)
  • more GLLAMM internalization
8.1 July 2003
  • updated ml
8.2 October 2003
  • graphics changes
9.0 April 2005
  • mata matrix programming language
  • survey features
  • linear mixed models
  • multinominal probit models
9.1 September 2005
9.2 April 2006
10.0 June 2007
  • graph editor
  • logistic and Poisson models with complex, nested error components
10.1 August 2008
11.0 July 2009
  • factor variables
  • margins postestimation command
  • multiple imputation
11.1 June 2010
11.2 March 2011
12.0 July 2011
  • automatic memory management
  • structural equation modeling
12.1 January 2012
13.0 June 2013
  • long strings
  • treatment effects
13.1 October 2013
14.0 April 2015
  • unicode support
  • Bayesian statistical analysis
14.1 October 2015
14.2 September 2016
15.0 June 2017
  • latent class analysis
  • PDF and Word documents
  • color transparency or opacity in graphs
15.1 November 2017
16.0 June 2019
  • frames (multiple datasets in memory)
  • lasso regression
  • automated reporting
  • updated choice models
16.1 February 2020
17.0 April 2021
  • updated tables command
  • bayesian econometrics
18.0 April 2023
  • Bayesian model averaging
  • causal mediation analysis
  • heterogeneous difference-in-differences

Программные продукты

[ редактировать ]

Существует четыре сборки Stata: Stata/MP, Stata/SE, Stata/BE и Numerics от Stata. [17] В то время как Stata/MP допускает встроенную параллельную обработку определенных команд, Stata/SE и Stata/BE имеют узкие места и ограничивают использование только одним ядром. [18] Stata/MP выполняет определенные команды примерно в 2,4 раза быстрее, что составляет примерно 60% от теоретической максимальной эффективности, при запуске параллельных процессов на четырех ядрах ЦП по сравнению с версиями SE или BE. [18] Numerics от Stata позволяет веб-интеграцию команд Stata.

Версии SE и BE различаются объемом памяти, которую могут использовать наборы данных. Хотя Stata/MP может хранить от 10 до 20 миллиардов наблюдений и до 120 000 переменных, Stata/SE и Stata/BE хранят до 2,14 миллиардов наблюдений и обрабатывают 32 767 переменных и 2048 переменных соответственно. Максимальное количество независимых переменных в модели составляет 65 532 переменных в Stata/MP, 10 998 переменных в Stata/SE и 798 переменных в Stata/BE. [17]

Цены и лицензирование Stata зависят от его предполагаемого использования: бизнес, правительство/некоммерческая организация, образование или обучение. Однопользовательские лицензии можно продлевать ежегодно или бессрочно. Другие типы лицензий включают одиночную лицензию для одновременного использования пользователями, лицензию для сайта, корпоративную лицензию для одного пользователя для оптовых цен или студенческую лабораторию. [19]

Пример кода

[ редактировать ]

Следующий набор команд посвящен простому управлению данными. [20]

sysuse auto                 // Open the included auto dataset
browse                      // Browse the dataset (opens the Data Editor window)

describe                    // Describes the dataset and associated variables
summarize                   // Summary information about numerical variables

codebook make foreign       // Summary information about the make (string) and foreign (numeric) variables

browse if missing(rep78)    // Browse only observations with missing data for variable rep78
list make if missing(rep78) // List makes of the cars with missing data for variable rep78

Следующий набор команд переходит к описательной статистике.

summarize price, detail          // Detailed summary statistics for variable price

tabulate foreign                 // One-way frequency table for variable foreign
tabulate rep78 foreign, row      // Two-way frequency table for variables rep78 and foreign

summarize mpg if foreign == 1    // Summary information about mpg if the car is foreign (the "==" sign tests for equality)
by foreign, sort: summarize mpg  // As above, but using the "by" prefix.
tabulate foreign, summarize(mpg) // As above, but using the tabulate command.

Простой тест гипотезы:

ttest mpg, by(foreign) // T-test for difference in means for domestic vs. foreign cars

Графические данные:

twoway (scatter mpg weight)                     // Scatter plot showing relationship between mpg and weight
twoway (scatter mpg weight), by(foreign, total) // Three graphs for domestic, foreign, and all cars

Линейная регрессия:

generate wtsq = weight^2                      // Create a new variable for weight squared
regress mpg weight wtsq foreign, vce(robust)  // Linear regression of mpg on weight, wtsq, and foreign
predict mpghat                                // Create a new variable contained the predicted values of mpg
twoway (scatter mpg weight) (line mpghat weight, sort), by(foreign) // Graph data and fitted line
Графики регрессии из автоматического набора данных в Stata 17

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Ньютон, Х. Джозеф (2005). «Разговор с Уильямом Гулдом» . Стата-журнал . 5 (1): 19–31. дои : 10.1177/1536867X0500500103 . S2CID   118322998 .
  2. ^ Кокс, Николас Дж. «Часто задаваемые вопросы по статистике» . Статалист: Стата Форум . Проверено 24 апреля 2021 г.
  3. ^ «Манипулирование данными STATA: основы и приложения 7» (PDF) . Iuj.ac.jp. ​Проверено 27 января 2022 г.
  4. ^ Суарес, Эрик; Перес, Синтия; Ногерас, Грасиела; Морено-Горрин, Камилла (2016). биостатистика в общественном здравоохранении с использованием статистики .
  5. ^ «Дисциплины» . Stata: Программное обеспечение для статистики и обработки данных . Проверено 21 апреля 2021 г.
  6. ^ Перейти обратно: а б с д и ж г час я Кокс, Николас Дж. (2005). «Краткая история Stata к 20-летию» . Стата-журнал . 5 (1): 2–18. дои : 10.1177/1536867X0500500102 . S2CID   118366843 . Проверено 22 апреля 2021 г.
  7. ^ Перейти обратно: а б Гулд, Уильям В.; Кокс, Николас Дж. «Когда была впервые выпущена Stata? Когда были выпущены более поздние версии?» . Stata: Программное обеспечение для статистики и обработки данных . Проверено 22 апреля 2021 г.
  8. ^ «Что нового в Стате?» . Stata: Программное обеспечение для статистики и обработки данных . СтатаКорп . Проверено 25 апреля 2023 г.
  9. ^ «Кадры данных: несколько наборов данных в памяти» . Стата.com . Проверено 13 августа 2020 г.
  10. ^ «Stata 16 поможет сохраниться» . Стата.com .
  11. ^ Глоссарий и указатель Stata: выпуск 17 (PDF) . Колледж-Стейшн, Техас: Stata Press. стр. 1–50. ISBN  1-59718-283-4 .
  12. ^ «Особенности Статы» . Stata: Программное обеспечение для статистики и обработки данных . СтатаКорп . Проверено 24 апреля 2021 г.
  13. ^ «Программа — определение программ и управление ими» (PDF) . Stata: Программное обеспечение для статистики и обработки данных . Стата Пресс . Проверено 24 апреля 2021 г.
  14. ^ «ssc — установка и удаление пакетов из SSC» (PDF) . Stata: Программное обеспечение для статистики и обработки данных . Стата Пресс . Проверено 24 апреля 2021 г.
  15. ^ «Используйте Python и Stata вместе | Stata» .
  16. ^ «Как постепенно переключить рабочий процесс со Stata на R · Фредерик Солт» . Fsolt.org . Проверено 27 января 2022 г.
  17. ^ Перейти обратно: а б «Какая Стата мне подходит?» . Stata: Программное обеспечение для статистики и обработки данных . Проверено 23 апреля 2021 г.
  18. ^ Перейти обратно: а б «Параллельная Стата» . Гарвардская школа бизнеса.
  19. ^ «Заказать программное обеспечение Stata» . Stata: Программное обеспечение для статистики и обработки данных . СтатаКорп . Проверено 25 апреля 2021 г.
  20. ^ Начало работы с Stata для Windows (PDF) (выпуск 17-е изд.). Колледж-Стейшн, Техас: Stata Press. стр. 1–19. ISBN  1-59718-334-2 . Проверено 25 апреля 2021 г.

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b2abe8124c2b25ffdf40f19cc8656f63__1712757720
URL1:https://arc.ask3.ru/arc/aa/b2/63/b2abe8124c2b25ffdf40f19cc8656f63.html
Заголовок, (Title) документа по адресу, URL1:
Stata - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)