Диссертация (1168467), страница 89
Текст из файла (страница 89)
Программные инструменты для сбора1Chumtong J., Kaldewey D. Beyond the Google Ngram Viewer: Bibliographic Databases and Journal Archives as Toolsfor the Quantitative Analysis of Scientific and Meta-scientific Concepts. FIW Working Paper No. 08. Bonn: RheinischeFriedrich-Wilhelms-Universität,2017.[Электронныйресурс]//URL:https://www.researchgate.net/publication/319313734_Beyond_the_Google_Ngram_Viewer_Bibliographic_Databases_and_Journal_Archives_as_Tools_for_the_Quantitative_Analysis_of_Scientific_and_Meta-Scientific_Concepts(Accessed28.02.1918).411данных вроде Netvizz, графовой базы данных Neo4j и приложения Linkuriousпозволяют осуществлять анализ данных на основе открытых источников (opensource intelligence), фиксируя перекрестные связи друзей любого пользователяFacebook между собой и визуализируя их в виде таблицы.
Ego (здесь –пользователь) окажется в центре системы коммуникативных связей своихреальных и виртуальных «друзей», но только тех, кто имеет профили в той жесоциальной сети (см. рис. 3).Наглядное изображение элемента информационной модели системыобщества отдаленно напоминает визуализацию путей интернет-маршрутизации,где вместо сообщества некоторого числа конкретных Ego фигурируют их IPадреса (рис. 3).Рис. 3.
Визуализация коммуникативныхсвязей конкретного Ego на Facebook1.Что касается создания новых программных инструментов для изученияистории, то оно подразумевает синтез гуманитарных наук с точными науками, врезультате которого появилась историческая информатика. В рамках реализациипроекта «Лаборатории комплексных цифровых технологий» ИВ РАН планируетсяпривлечение к работе историков как минимум двух команд профессионалов вFacebook. Визуализация социальных связей // Data Review [Электронный ресурс] // URL:http://datareview.info/article/facebook-vizualizatsiya-sotsialnyih-svyazey (дата обращения: 21.12.2018).
По материаламLinkedIn Pulse.1412области цифровых технологий: специалистов в области машинного обучения(дата-аналитиков, создающих нужные модели, на основании данных), вособенности – в сфере обработки естественного языка, и разработчиковпрограммных инструментов. Первая команда будет вовлечена непосредственно вмоделированиеалгоритмовмашинногообучения,вторая–всозданиеприложений, в которой эти модели будут присутствовать.Наиболее актуальные потребности цифровой истории и вспомогательныхисторическихдисциплин(компьютерногоисточниковеденияицифровойтекстологии, цифровой археологии, исторической географии, использующейтехнологии ГИС) переводятся в плоскость практического обсуждения, ведетсяработа над техническими заданиями практических методов и методик цифровойгуманитаристики, учитывающих потребности востоковедения, исследовании вобласти формализации исторической информации, создании информационнойсистемы научного знания (на примере истории народов Востока), баз данных иэкспертных систем.Развитие машинного обучения как раздела искусственного интеллекта ипрограмм автоматического перевода, основанных на алгоритмах обработкиестественного языка, уже сегодня позволяет приступить к практическойреализации программы оптического распознавания арабографических (арабских,персидских, турецко-османских и др.) рукописей.
Для реализации этойпрограммы, в которой чрезвычайно важно понимание (т.е. корректное чтение иизвлечение смысла текста и контекста источника), может быть востребованкросскультурный метод универсальных языковых эквивалентов. Один изуспешных примеров классификации и генерации текста, которые успешноиспользуются в технологии распознавания рукописного ввода – это рекуррентныенейронные сети (англ. Recurrent neural network).
Алгоритмы, разработанные врамках данного направления исследований, могут быть использованы вэпиграфике, сфрагистике, нумизматике, в том числе для создания программыопределения монет, а также в подводной археологии с использованием роботов(оптическое распознавание подводных археологических объектов), цифровой413интерактивной библиотеке восточных рукописей, а также в интерактивныхисторических картах.Большие преспективы ИКТ имеют в источниковедении. Блестящимпримером восстановления навсегда, как считалось ранее, утраченных для наукидревних текстов является реализация в 2000-х гг. масштабного международногопроектапоэлектроннойдокументациикавказскихязыковARMAZI,поддержанного Фондом Фольксвагена.
В 2004 г. при помощи специальногооборудованиявмонастыреСв.ЕкатеринынаСинаебылисделаныультрафиолетовые фотографии рукописей, которые позволили восстановитьстертый кавказско-албанский текст, находившийся под грузинским текстом, вдвух палимпсестах Лекционария – Sin. Geo. N 13 и N 551. Мультиспектральныефотоснимки всех листов манускриптов вместе с последующей расшифровкойтекста и сопоставлением его с другими (греческим, сирийским, армянским,грузинским,удинским,русским,английским)переводамиБиблиибылиопубликованы отдельно2. Это событие открыло новую веху в изученииКавказской Албании (Алуана) – древнейшего государства на Восточном Кавказе.Наука накопила большой опыт и в области цифровой археологии.
Так,проект Million Image Database Оксфордского института цифровой археологиипозволил создать 3D-фотографии тысяч исторических памятников архитектуры вряде стран Ближнего Востока, на основе которых они могут быть с высокойточностью воспроизведены в любом месте земного шара3. Этот опыт может бытьвостребован для восстановления исторических памятников, разрушенных вовремя войн и конфликтов.Внедрение идей системно-коммуникационного подхода позволит такжепродвинуться вперед в технологиях, на основе которых развиваются цифровыегуманитарные науки.
Среди них наиболее преспективными для востоковеденияСм.: The Caucasian Albanian Palimpsests of Mt. Sinai. Vol. I. Ed. by J. Gippert, W. Schulze, Z. Alexidze, J.-P. Mahé.Turnhout; Brepols Publishers, 2008. P. I-2 – I-29.2The Caucasian Albanian Palimpsests of Mt. Sinai. Vol. II. Ed.
by J. Gippert, W. Schulze, Z. Alexidze, J.-P. Mahé.Turnhout; Brepols Publishers, 2008.3См.: The Institute for Digital Archeology. [Электронный ресурс] // URL: http://digitalarchaeology.org.uk (датаобращения: 12.12.2018).1414представляется цифровая антропология, которая позволяет максимально широкоиспользовать возможности интерективного социального моделирования в режимереального времени, с непрерывной записью всей полезной информации, ицифровая лингвистика с ее революционными перспективами качественногоавтоматического перевода, использующего растущий потенциал искусственногоинтеллекта.5.1.2. Цифровые анналы истории:к вопросу о возможностях реализацииинформационной модели обществаНа начальном этапе разработки теоретической модели задача исследователясводится к выбору принципов формализации социальных связей и отношений исозданию на этой основе единых образцов анкет и информационных полей, внеобходимой мере отражающих все значимые параметры.
Эти поля заполняютсяне в произвольном порядке, а путем самостоятельного персонального выборакаждымпользователемсоответствующихформализованныхпунктов,свозможностью представления информации на всех существующих языках.Система выбора должна быть достаточно детализированной, чтобы обеспечиватьнеобходимый результат, но дробность вопросов не может быть бесконечной. Впроцессе создания технического задания и биологические, и социальные, ивиртуальные связи индивида должны быть описаны с помощью общихидентификаторов,условныхобозначений,основныхивспомогательныхатрибутов сущности, функций и алгоритмов.К.
Дж. Дейт, признанный эксперт в области баз данных SQL, различал триосновных класса сущностей: стержневые, ассоциативные и характеристические, атакже подкласс ассоциативных сущностей – обозначения1. В данном случаестержневая сущность – каждое человеческое существо, независимо от его личныхДейт Дж. К.SQL и реляционная теория. Как грамотно писать код на SQL / пер. А. Слинкина. М.: Символ–плюс, 2010.1415характеристик.