Сжатие электронных пособий |
Подбор оптимальной схемы сжатия для электронных учебных пособийАвтор: Трясцын В.А.При хранении и размещении электронных учебных пособий в сети учебного заведения, а также для предоставления централизованного доступа на сайте к учебным материалам, необходимо использовать архивацию. Поскольку раздробление материалов возможно по дисциплинам, по курсам и по семестрам, то объем информации для сжатия указанных видов материалов находится в следующих диапазонах: для материала по дисциплине – 10-20 Мб; по семестру – 200-300 Мб; по курсу – 700-800 Мб. Информация, которая подвергается сжатию, содержит широкий диапазон форматов – *.pdf, *.jpg, *.doc и т.д. Здесь следует отметить, что изображения формата *.jpg уже были сжаты по алгоритму JPEG и их повторное сжатие не даст результатов. Следует отметить, что величина информации ежегодно возрастает, так как материалы совершенствуются для обеспечения удобной навигации и полноты раскрытия предметной области. Сжатие бывает без потерь (когда возможно восстановление данных без искажений) и с потерями (восстановление возможно с незначительными искажениями). Второй тип можно применять к сжатию фото-, аудио- и видеоинформации (на фотографических иллюстрациях, предназначенных для воспроизведения на экране, потеря 5% информации обычно некритична, а в некоторых случаях можно допустить и 20-25%.). Первый же метод подходит для сжатия текстов, баз данных и программ, он основан на устранении избыточности информации. Сжатие без потерь в основном использует 2 группы алгоритмов: алгоритмы, основанные на перекодировке информации (они же алгоритмы Хаффмана) и алгоритмы, основанные на выявлении повторов в данных, называемые RLE (Run Length Encoding). В число рассмотренных систем архивации вошли архиваторы работающие как в среде ОС Windows: WinZip, WinRAR, ARJ32, WinACE, Power Archiver, 7Zip так и Linux: Bzip2, Gzip, P7zip, RAR. Часть из представленных архиваторов используют несколько алгоритмов сжатия в зависимости от типа данных. В большинстве случаев при использовании того или иного алгоритма криптографии пользователь не знает в полной мере математическую основу преобразования информации и непосредственно алгоритм. При шифровании с уменьшением размера файлов для упаковки учебных материалов нет необходимости в использовании неочевидных алгоритмов и скрытых возможностей по обеспечению безопасности, поскольку главная цель не обеспечить секретность, а максимально уменьшить размер. Поэтому становится возможным применение единого алгоритма, очевидного для пользователя. При упаковке группы исходных файлов создается один большой файл, который может иметь как сплошную, так и несплошную структуру. Если сжатие применяется к каждому исходному файлу отдельно, то полученный архив является несплошным. Если сжатие применяется ко всей группе файлов как к единому целому, полученный архивный файл является сплошным. В первом случае размер архивного файла больше, чем во втором. С другой стороны, при сбое в несплошным архиве повреждается и может быть утрачен лишь один исходный файл, в области размещения которого произошел сбой, а при сбое в сплошном архиве есть угроза утраты всех файлов или, по крайней мере, тех файлов, которые расположены после места сбоя. Это особенно важно в тех случаях, когда архивный файл «разрезан» на отдельные тома. Критерием для выбора является надежность носителя сжатой копии. Так как учебные материалы будут храниться на жестком диске, то допускается применения сплошного архива. Так как скорость сжатия не важна, то архивирование будет при максимальных настройках сжатия. Для тестов сжимались различные виды данных: текстовые файлы объемом 100026КБ. 1566 файлов, среди которых DOC; Объявление: смешанное содержимое объемом 169758КБ, где в качестве данных использовались установленные в системе Sun Java 1.5.0, Mozilla Firefox 1.5, Opera 8.50 с пользовательскими данными и Picasa 2. В каталоге оказалось 2077 файлов разнообразных типов. Текстовую и графическую информацию лучше всех сжимают P7Zip и WinACE и WinRar. При сжатии видео хорошие результаты показал Winzip в отдельных тестах для Windows-платформ. В смешанной информации 7zip показал наилучшие результаты. Из данных тестов следует, что нельзя сказать однозначно, что один архиватор лучше, а другой хуже. Среди остальных особо выделяются 7Zip, WinRar, WinZip, WinAce. Причем, для платформы Linux – однозначный выбор P7Zip, он показывал практически те же результаты, что и 7Zip для ОС Windows. |
< Предыдущая | Следующая > |
---|