49490 (666296)
Текст из файла
Содержание
Введение
1. История электронных библиотек
2. Электронные библиотеки, проблемы авторского права и их решение
3. Форматы выкладываемых произведений
3.1 Графические растровые форматы
3.2 Графические векторные форматы с оформлением
3.3 Простой текст (plain text)
4. Программы для чтения электронных книг
4.1 Обзор по самым известным программам для чтения электронных книг
Литература
Введение
Электронная книга (англ. - e-text или e-book) - версия бумажного издания в цифровом (электронном виде). Электронной книгой называется и цифровой вариант издания, так и ряд устройств, которые используются для их прочтения.
Популярность электронных книг набирает обороты с каждым днем. Говорят, что их появление - важнейшее событие в истории издательского дела со времени изобретения печатного станка. Вся планета повально увлечена оцифровкой всех типов книг, которые, по мнению самих оцифровщиков, представляют ценность для любого, даже самого малого количества читателей. В первую очередь, для пользователей привлекателен малый объем электронных книг (на одном ПК или КПК можно хранить десятки и сотни тысяч) и малая же стоимость (большинство литературных изданий в цифровом виде доступно для скачивания, оплачивается лишь передача объема информации через Интернет.). Удобным считается также возможность полнотекстового поиска – при условии, что текст набран или распознан.
Широкое распространение получила практика сканирования домашней библиотеки. Для того, чтобы громоздкие шкафы с пыльными книгами не занимали много лишнего места, часть книжного массива оцифровывается и затем утилизируется - кроме, конечно, самых ценных и раритетных экземпляров. Оцифровку домашней библиотеки обычно производят либо планшетным сканером, либо цифровым фотоаппаратом, распознавание текста производят редко.
Оцифровка библиотечных фондов – одно из самых перспективных направлений в области внедрения высоких технологий и автоматизации. За границей практика создания электронных библиотек намного обширнее, однако в России за последние годы тенденция к переводу библиотечных массивов в электронный стремительно набирает обороты. Появляются электронные фонды библиотек для детей, ВУЗовские и школьные электронные библиотеки, а также электронные библиотеки госучреждений. Необходимость создания подобных ресурсов признано на правительственном уровне - например, на создание электронного библиотечного фонда им. Б.Н. Ельцина выделено 5 млрд. рублей с тем, чтобы доступ к ней имелся из любой библиотеки страны, и была возможность получить максимум информации по любой теме, связанной с законом и государством.
Для сканирования фондов библиотек закупаются профессиональные книжные сканеры, предпочтение отдается сканерам с V-образной колыбелью, так как подобная конструкция позволяет делать снимки страниц книги не раскрывая ее полностью, а значит, исключается возможность каких-либо повреждений – критично особенно для старинных, ценных экземпляров.
1. История электронных библиотек
Первым проектом по созданию электронной библиотеки стал Проект «Гутенберг» (1971 год). В Рунете первой электронной библиотекой стала библиотека Максима Мошкова.
С ростом числа пользователей компьютеров и интернета всё большее количество людей начинает пользоваться электронными книгами. В то же время число пользователей оффлайновых библиотек снижается. Так за период 1997—2002 годы в Университете Айдахо количество посетителей снизилось более чем на 20 %, а число пользователей электронных версий за период 1999—2002 увеличилось на 350 %. В связи с этим многие библиотеки начали создавать электронные версии хранящихся в их фондах книг.
В 1990 году библиотекой конгресса США был начат проект «Память Америки». В рамках проекта предоставляется свободный и бесплатный доступ к электронным материалам по истории США.
В 2002 году Google начинает собственный проект по оцифровке книг. В декабре 2004 года было объявлено о начале работы библиотечного проекта «Google Print», который в 2005 году был переименован в «Поиск книг Google».
20 ноября 2008 года начала функционировать общеевропейская цифровая библиотека Europeana.
21 апреля 2009 года состоялось официальное открытие Всемирной цифровой библиотеки.
27 мая 2009 года в Санкт-Петербурге была открыта президентская библиотека имени Бориса Ельцина, в задачи которой входит предоставления электронных материалов по истории России.
2. Электронные библиотеки, проблемы авторского права и их решение
Многие электронные библиотеки публикуют литературные произведения без предварительного согласия авторов, и хотя в некоторых из них по первому требованию автора его тексты снимаются с сайта, де-юре они нарушают законы об авторском праве.
Тем не менее, в результате работы Государственной Думы и Совета Федерациии, президентом РФ Медведевым Д.А. был подписан "Федеральный закон Российской Федерации от 27 октября 2008 г. N 183-Ф3 "О внесении изменений в статью 18 Федерального закона «О библиотечном деле» суть которого «Российской газете» пояснил генеральный директор Российской государственной библиотеки Виктор Федоров:
Что касается оцифровки библиотечных фондов, то отношение к этому закону двоякое. С одной стороны, он действительно утверждает право библиотек использовать достижения современных информационных технологий и переводить имеющиеся у них фонды в цифровую форму. С другой стороны, последний абзац закона возвращает нас к четвертой части Гражданского кодекса, где сказано, что оцифровка должна осуществляться только по договоренности с автором. А это для нас головная боль. Библиотека не в состоянии сама заключать договора с авторами. Во всей мировой библиотечной практике этим занимаются специальные организации.
Таким образом, прекрасно, что библиотекам, наконец, подтвердили их право на оцифровку их фондов. Но с точки зрения профессионального библиотекаря, мне очень жаль, что мы не пошли дальше в этом направлении. В мировой практике даже есть устоявшийся термин «библиотечные исключения». В США, Европе библиотеки, реализуя конституционное право граждан на получение информации, имеют право переводить в цифровую форму свои фонды, не спрашивая разрешения у авторов. Разумеется, это делается (и это тоже устоявшийся термин) «на принципе добропорядочного и честного использования». Это значит, что речь идет о предоставлении оцифрованной информации только в научных, культурных и образовательных целях, а не для коммерческой выгоды. Если речь идет о коммерческой выгоде, то, уже без всяких исключений, надо договариваться с автором.
3. Форматы выкладываемых произведений
Форматы размещаемых в электронных библиотеках произведений можно разделить на две категории — форматы, предназначенные для чтения текста он-лайн и форматы, предназначенные для скачивания на компьютер читателя.
Самый популярный формат первой категории — HTML, однако библиотека Мошкова, например, выкладывает тексты в формате TXT. Связано это с традицией: во время появления этой библиотеки (1994 год) скорости работы в интернет были весьма низки, и оправданным было использование самого лёгкого формата. Также по философии библиотеки каждое произведение должно было целиком умещаться на стандартном носителе информации (каковым тогда являлась дискета).
Форматы для скачивания — заархивированный TXT; RTF и DOC; Mobipocket.PRC (формат для чтения книг на кпк и телефонах). Также очень популярен формат FictionBook, созданный специально для хранения литературных произведений. Первая электронная библиотека — Проект «Гутенберг» — требует в файлах для скачивания использовать текстовый формат в архивах ZIP для того, чтобы тексты можно было читать практически на любых устройствах, и чтобы они не были потеряны в случае исчезновения программ для обработки используемых форматов.
Книги, изобилующие математическими формулами и сложными схемами, после сканирования переводить в текстовый формат намного сложнее, поэтому часто их хранят в графическом формате, обычно DjVu и PDF. Тогда как PDF при таком применении представляет собой просто объединенный в один файл набор изображений TIFF, DjVu использует специальный алгоритм, позволяющий получать в несколько раз меньшие файлы даже при сжатии без потерь.
Наоборот, если существует электронный оригинал книги — с редактируемым текстом и векторными изображениями, то PDF будет иметь лучшее качество и меньший объём.
Перед теми, кто занимается оцифровкой изданий или набором книг непосредственно на ПК, рано или поздно встает вопрос – в каком формате - поскольку их множество - издавать электронную книгу или, соответственно, в какой формат ее импортировать из текстового.
Существует несколько групп форматов электронных книг – графические и растровые форматы. Растровые форматы представляют объект в виде множества точек, векторные – в виде простейших геометрических фигур (точки, линии, многоугольники). Таблица внизу классифицирует их именно по этому признаку.
Однако, как и любая другая, эта классификация условна. Например, PostScript (.ps,.eps), PDF могут быть чисто векторными. Так же DOC, PDF могут содержать только растровые отсканированные картинки или же наоборот - содержать только текст.
Существует также разделение форматов электронных книг на предназначенные для чтения текста он-лайн и для сохранения на компьютере пользователя. К первой группе относятся файлы такого формата, как HTML и TXT, ко второй – RTF, DjVu, PDF и проч.
Здесь вы можете узнать краткую справочную информацию о различных форматах электронных книг.
3.1 Графические растровые форматы
TIFF - Формат для хранения изображений с большой глубиной цвета. Чаще всего используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. Глубина изображение делает TIFF незаменимым форматом для тех, кто занимается оцифровкой бумажных изданий, так как процесс распознавания текста упрощается во много раз.
JPEG - Данный формат использует сильное сжатие, уровень которого можно регулировать, с потерей информации.
Применяется для хранения высококачественных изображений, позволяет использовать до 16 миллионов цветов, именно поэтому электронные книги в этом формате также имеют место - для печати он непригоден, а для демонстрации на дисплее подходит идеально.
DjVu - Использует специальный алгоритм, позволяющий получать файлы меньшего размера при сжатии без потерь за счет технологии, разработанной специально для хранения оцифрованных документов рукописей, книг, журналов. Популярнейший формат книг в файлообменных сетях.
3.2 Графические векторные форматы с оформлением
RTF - Формат, поддерживаемый большинством текстовых редакторов, созданный для документов в среде ОС Windows. обеспечивает возможность сохранения структуры текстовых документов, позволяет выделять их фрагменты (курсивом или жирным шрифтом, создавать колонки и т.п.). Книги в формате RTF доступны для скачивания во многих книгообменных сайтах.
HTML - Стандартный язык разметки документов во Всемирной паутине. Разметка позволяет вставку спецсимволов, изменение размера, типа, начертания шрифта, создание гиперссылок и таблиц, выравнивание текста. Электронные книги в формате HTML чаще всего выставляются в полнотекстовом виде на сайте, в этом случае в скачивании на компьютер нет необходимости.
OPF FlipBook - Открытый формат электронных книг - стандартная версия программы FlipAlbum создает альбомы-книги FlipBooks с расширением OPF (Open Electronic Book Package Format). Эти файлы могут быть просмотрены с помощью самой программы или бесплатной утилиты для работы с OPF-файлами.
HTMLHelp - Книга - файл формата.chm. Содержит в себе набор HTML-страниц, может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Используется для создания справки в ОС Windows и, по аналогии, для создания книг, с помощью специального программного обеспечения.
SGML - Стандартный общий язык разметки для документов. Широко используется в издательском деле - рукописи зачастую передаются в электронном SGML-структурированном виде, что значительно облегчает работу наборщиков и дизайнеров.
XML - XML — текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (конвертации, хранению, управлению) в любой среде, поэтому на его основе создан формат FictionBook.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.