НАТ - НАЦИОНАЛЬНАЯ АССОЦИАЦИЯ ТЕЛЕРАДИОВЕЩАТЕЛЕЙ - ПРОФЕССИОНАЛЬНОЕ ОБЪЕДИНЕНИЕ ТЕЛЕРАДИОКОМПАНИЙ РОССИИ
Портал создан при финансовой поддержке Федерального агентства
по печати и массовым коммуникациям
 
 

Архив новостей НАТ
Архив новостей Законодательство и практика
Архив новостей медиасообщества
Архив главных новостей
Архив Обучение
Архив конкурсов и фестивалей
Архив выставок и конференции
Календарь событий
(За предыдущие 90 дней)
Календарь событий
(За следующие 90 дней)
Все события, начиная с сегодняшнего дня
Академия НАТ
Во втором семинаре «Академии НАТ» приняли участие более 120 слушателей
Конкурс «Современник на экране» в рамках фестиваля социально значимых телепрограмм и телефильм
Состав жюри творческого конкурса «Современник на экране» в рамках фестиваля социально значимых телепрограмм и телефильмов «Герой нашего времени» 2016
Видео победителей
Мероприятия НАТ 2018
Как вступить в НАТ
Что дает членство в НАТ
Как вcтупить в НАТ телекомпаниям
Как вcтупить в НАТ радиостанциям
Положение о членских взносах
Устав НАТ
Архив за 2015 год
Премия имени Владимира Зворыкина
Фестивалю детского телевидения «ВКЛЮЧАЙСЯ» - 10 лет
Конкурс «Современник на экране», в рамках фестиваля социально значимых телепрограмм и телефильмов «Герой нашего времени»!
Архив за 2016 год
Включайся 2016
Конкурс «Современник на экране», в рамках 10 фестиваля социально значимых телепрограмм и телефильмов «Герой нашего времени»!
Архив за 2017 год
Включайся 2017
Академия НАТ (август)
Академия НАТ (май)
Академия НАТ
Архив за 2018 год
Академия НАТ январь 2018
Архив за 2014 год
Премия имени Владимира Зворыкина 2014 год
«ВКЛЮЧАЙСЯ» 2014
Конкурс «Современник на экране», в рамках фестиваля социально значимых телепрограмм и телефильмов «Герой нашего времени»!
Архив за 2013 год
Премия имени Владимира Зворыкина 2014
Конкурс «Современник на экране», в рамках фестиваля социально значимых телепрограмм и телефильмов «Герой нашего времени»!
«ВКЛЮЧАЙСЯ» 2013
Архив за 2012 год
Конкурс «Современник на экране», в рамках фестиваля социально значимых телепрограмм и телефильмов «Герой нашего времени»!
«Включайся!» 2012
«Новые медиа» России на IBC
Золотой луч
XVI Международный конгресс Национальной ассоциации телерадиовещателей
Архив за 2011 год
XV Международный конгресс НАТ
«Включайся!» 2011
Творческий конкурс «Современник на экране» в рамках фестиваля социально значимых телепрограмм и телефильмов «Герой нашего времени»
Архив за 2010 год
NAB SHOW 2010
«Включайся!» 2010
«Золотой луч» 2010
Герой нашего времени 2010
XIV Международный конгресс НАТ
Архив за 2009 год
Герой нашего времени 2009
Выставка IBC 2009: экспозиция «Русский дом» и конференция «Цифровая Россия»
Национальная премия в области спутникового, кабельного и интернет телевидения «Золотой луч»
XIII Международный конгресс НАТ
«Включайся!» 2009
Архив за 2008 год
Выставка IBC
Цифровая Россия
Включайся!
Герой нашего времени 2008
XII Международный конгресс НАТ
Касается Каждого
Архив за 2007 год
Включайся!
Цифровая Россия
Герой нашего времени
Лучшая теле - и радиокомпания 2007 года
XI Международный конгресс НАТ
Архив за 2006 год
Х Международный Конгресс НАТ
Правление НАТ
Комиссии
Технологический комитет
Состав Технологического Комитета НАТ
Информационно-аналитический центр
Этический кодекс
Члены Ассоциации
Лауреаты НАТ
Избранное
Техника и технологии
Право и СМИ
Медиаизмерения и реклама
Зарубежный опыт
Интервью




Логин  
Пароль
Запомнить
Регистрация на сайте
Забыли пароль?


 

Техника и технологии

05.04.07


О каталогизации архивных аудиовидеоматериалов

Вначале приведу несколько определений, чтобы установить терминологические понятия:

Под каталогизацией понимается процесс совокупной обработки каких-либо информационных объектов и работы с каталогами. Записи в каталогах имеют предопределенную структуру и организованы в соответствии с заданными систематическими правилами, схемами классификации. Каталогизация представляет описательную и содержательную сферы. К описательной относятся процессы, связанные с описанием различных видов теле- радиопрограмм, с гармонизацией правил описания на международном уровне, с развитием форматов и стандартов, о которых сегодня уже говорилось. К содержательной сфере относятся процессы раскрытия содержания программ, поиска информации, связанные с этим вопросы лингвистического обеспечения. Например, тезаурус Национального аудиовизуального института Франции дает для описания в архиве около 250 видов данных.

Одно из существенных препятствий на пути освоения и эффективного использования корпоративного телерадиоконтента – непрозрачность информационного содержимого архивных материалов. Структура и полнота каталожных записей должна быть заточена на получение характеристик программы, релевантных поисковому запросу. Хорошая система каталогизации улучшает возможности поиска материалов, а поисковый механизм может найти материал только при хорошей каталогизации.

Если сравнить каталогизацию с картографией, то выбор масштаба детальности описания и представления остается за нами. В цифровой среде мы можем контролировать каждый аспект производства и распространения в степени, невозможной для аналоговой технологии. Появляются новые подходы, аспекты и методы работы с данными. Например, возможность гибко сегментировать контент. В каталожной записи возникает иерархия ссылок различного функционального и целевого назначения, как между элементами данных внутри одной программы, так и между программами во всех воплощениях программ на различных стадиях производственного цикла. Другой аспект связан с тем, что каталогизация начинается с момента попадания материала в производственную систему компании. Цифровая среда перераспределяет нагрузку ввода каталожных данных между всеми участниками цикла создания программ. Также она дает возможность импорта данных из систем планирования, постпроизводства и других.

Поскольку каталогизация представляет собой наиболее развитую область архивной и библиотечно-библиографической практики, в первую очередь мы обратились к опыту специалистов-практиков ведущих государственных архивов, библиотек и институтов. Результат работ по индексированию материалов показывает, что существует много общего в описании: везде присутствуют такие сведения, как автор, название, жанр, тема, аннотация, дата создания и т.д. В отношении системы классификаторов можно сказать, что традиционно каталоги в архивах базировались на Схеме единой классификации, принятой в 60-е годы. На сегодняшний день, архивы ведут собственные разработки и обладают разветвленной системой классификаторов разного целевого и функционального назначения. Единой универсальной схемы, представленной как стандарт классификации или реальной попытки обобщения в виде коммерческого продукта на российском рынке, в практике сегодняшнего дня не существует.

Библиотеки в качестве классификаторов используют как собственные, так и универсальные системы.

Среди международных схем, отвечающих потребностям вещателей для каталогизации контента, можно назвать систему классификации радиотелевизионных программ `ESCORT 2.4`, разработанную Статистической группой Европейского вещательного союза. Эта система охватывает все стадии вещательного процесса компании от формирования концепции, и до фактической трансляции. Система включает административную и финансовую информацию, а так же информацию, касающуюся аудитории.

`Набор ядра метаданных Европейского вещательного союза для архива радио` (“EBU core metadata set for radio archives”) построен на известном стандарте Dublin Core (ISO 15836:2003 Information and documentation - The Dublin Core metadata element set) и дает 15 обязательных элементов для описания радиоархива. Для нас весьма актуальна схема PBCore (Public Broadcasting Metadata Dictionary) - это ресурс каталожных данных для общественных вещателей, разработанный американской Корпорацией общественного вещания. Версия PBCore 1.0 содержит 48 основных и субэлементов, которые делятся на 3 категории: интеллектуальный контент, интеллектуальная собственность и конкретизация. Схема более углублена в специфику телерадиовещания. В качестве ее достоинства можно отметить компактность схемы.

При всем разнообразии схем и рекомендаций существует общее информационное пространство – система словарей. Мы подготовили набор классификаторов и словарей, содержащий более 40 позиций: словарь наименований целевых назначений программы, словарь наименований целевых групп аудитории, словарь международных кодов и названий стран, словарь действующих кодов и названий языков и т.д. Подробно остановимся на двух из них.

Классификатор жанров используется для идентификации содержания программ по формальной структуре (форме). В качестве основы для построения словаря мы выбрали схему EBU Escort 2.4, которая определяет более 20 значений для кодирования. В ходе разработки жанрового классификатора, выделилось отдельное направление – классификация музыкального контента. Мы подготовили схему описания, которая включает помимо идентификации жанров и стилей музыки, словарь ролей исполнителей и классификатор инструментов.

Тематический (Subject) рубрикатор cодержит понятия предметной области и отражает содержание программы, отвечая на вопрос `о чем эта программа?`. Предметы обозначаются как ключевые слова и фразы, или как предметные рубрики, или как классифицированное описание. Мы столкнулись с проблемой выбора способа индексирования. Индексирование по ключевым словам специалистами признано неэффективным, т.к. в этом случае `по ходу дела` формируется неуправляемый словарь ключевых слов. Для нормализации такого словаря используются известные приемы: унификация формы именований, упорядочивание синонимов и пр. В результате получится уже не словарь ключевых слов, а список предметных рубрик. Индексирование по классификационной схеме дает ряд преимуществ, например, в сфере коммуникации снимает языковой барьер при международном обмене.

Системы, рекомендованные к использованию в качестве контролируемых словарей поля `Тема`:

Классификация Библиотеки Конгресса США, Предметные рубрики Библиотеки Конгресса США, Десятичная классификация Дьюи (ДКД), Универсальная десятичная классификация (УДК), Библиотечно-библиографическая классификация (ББК), IPTC система классификации контента Новостей.

Свой выбор какую систему использовать мы определили, основываясь на нескольких критериях. Во-первых, система должна быть достаточно мощной, чтобы `накрывать` весь спектр тематик. По объему представленной лексики лидируют УДК и ББК. Далее идет критерий происхождения системы и распространенности. Следующий критерий, комбинационные возможности. Здесь системы разделяются на два типа: фасетные и перечислительные. Перечислительные представляют собой колоссальные списки тем. Фасетные (комбинационные) дают возможность многоаспектного отражения понятий предмета. Важными критериями являются язык системы и форма реализации.

Мы выбрали систему УДК. Кратко говоря, наша идея разработки классификатора заключается в следующем: взять ТЕМЫ уже используемые на практике при описании программ и осуществить привязку-синхронизацию понятий в аспектах системы УДК. С одной стороны, мы получим список предметных рубрик, а с другой стороны, классификация по иерархическому признаку даст нам систематический каталог.

Часто задаваемый вопрос `зачем вообще необходим тематический рубрикатор, когда существует описание свободным текстом?` Вот некоторые аргументы: Во-первых, это обусловлено существованием различных видов поиска. Прямой поиск или поиск по известному предмету/факту – это только одна из стратегий. Другой, не менее популярной, является поисковая стратегия просмотра или обзора по какой-либо теме. В этом случае, исследуя многие релевантные источники, люди отбирают часть необходимой информации. Второй аргумент связан с тем, что как всякая классификация, предметизация по `теме` призвана дать полную смысловую картину окружения данного понятия. Выстраивая тематику по многоаспектной универсальной системе мы получаем полную и упорядоченную структуру и семантику, целостную картину или систему знаний о хранимых фондах. В-третьих, востребованность `Темы`. Часто по тематике выстраиваются коллекции фондов, подготавливаются всевозможные сборники и др. информационные подборки архивных материалов. И еще аргумент – статья № 34 закона о СМИ, которая обязывает вещателей хранить информацию о теме передачи.

Альтернатива ручной каталогизации - использование программ автоматического индексирования и категоризации контента. Это связано с развитием технологий аудио и видео поиска, автоматического распознавания образов, информационного извлечения и семантического анализа данных, динамической таксономией.

Формализация стандартизированного способа описания для каталогизации телерадиопрограмм даст вещателям общий описательный язык контента, способ коллективного использования и взаимодействия на всех уровнях.

Здесь изложены общие подходы ВГТРК для создания цифровых архивов. В настоящее время ведется работа по реализации архива редакции телевизионных новостей. Журналисты получат прямой доступ к архиву непосредственно с рабочих мест для поиска и монтажа сюжетов. При этом существенно изменится характер работы и функции как журналистов, так и работников архива.

Н.Б.Павлова - управление технического развития ВГТРК




 

: Новости : Календарь : Проекты и мероприятия : Вступить в НАТ : Архив Мероприятий : Правление НАТ : Публикации : Контакты : Друзья и партнеры :
© Национальная Ассоциация Телерадиовещателей.

Свидетельство о регистрации СМИ Эл № 77-8294
выдано МПТР РФ 23.09.2003 г.

Все права защищены.

Яндекс.Метрика
НАТ
Россия, 127051, Москва, ул. Неглинная, д. 15, стр. 1
Телефон: +7(495) 651-08-36
Факс: +7(495) 651-08-35