Апач PDFBox
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Apache PDFBox — это библиотека чистого Java с открытым исходным кодом , которую можно использовать для создания, рендеринга, печати, разделения, объединения, изменения, проверки и извлечения текста и метаданных из PDF - файлов.
Open Hub сообщает о более чем 11 000 коммитах (с момента запуска проекта Apache) 18 участниками, представляющих более 140 000 строк кода. PDFBox имеет хорошо зарекомендовавшую себя, зрелую кодовую базу, поддерживаемую командой разработчиков среднего размера, объем обязательств которой увеличивается с каждым годом . Используя модель COCOMO , потребовалось около 46 человеко-лет работы. [2]
Структура
[ редактировать ]Apache PDFBox имеет следующие компоненты:
- PDFBox: основная часть
- FontBox: обрабатывает информацию о шрифте.
- XmpBox: обрабатывает метаданные XMP.
- Предпечатная проверка (дополнительно): проверяет файлы PDF на PDF/A -1b. соответствие
История
[ редактировать ]PDFBox был запущен в 2002 году в SourceForge Беном Литчфилдом, который хотел иметь возможность извлекать текст PDF-файлов для Lucene . [3] В 2008 году он стал проектом инкубатора Apache, а в 2009 году — проектом верхнего уровня Apache. [4]
Preflight изначально назывался PaDaF и был разработан Atos worldline и передан в дар проекту в 2011 году. [5]
В феврале 2015 года Apache PDFBox был назван партнерской организацией с открытым исходным кодом Ассоциации PDF . [6]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с «Apache PDFBox — Блог» . pdfbox.apache.org . Фонд программного обеспечения Apache . Проверено 27 сентября 2022 г.
- ^ «Проект с открытым исходным кодом Apache PDFBox на Open Hub» . openhub.net. 18 марта 2017 г. Проверено 18 марта 2017 г.
- ^ Выпущены Apache PDFBox и FontBox 1.0.0 , The H Open, 16 февраля 2010 г.
- ^ Статус инкубации проекта PDFBox
- ^ Статус проверки интеллектуальной собственности (IP) кодовой базы PaDaF перед полетом
- ^ Apache™ PDFBox™ назван партнерской организацией с открытым исходным кодом Ассоциации PDF , 3 февраля 2015 г.