статьи и тезисы
 

Ассоциативный эксперимент с лексикой предметной области "Информатика и вычислительная техника"

Содержание

Введение

Об эксперименте

Анализ полученных данных

Литература

Введение

В настоящее время значительный интерес вызывают методы психолингвистических исследований и возможность использования их результатов в различных сферах практической деятельности людей. Особое место среди таких экспериментальных исследований занимают так называемые ассоциативные эксперименты, результатами которых является создание ассоциативных словарей. Обычно такие эксперименты затрагивают значительные массы людей и используют общеупотребляемую лексику [1]. Однако возможно проведение ассоциативного эксперимента и в какой-то узкой специализации. Настоящая статья посвящена анализу результатов “специализированного” ассоциативного эксперимента [2], проведенного в 1999-2000 гг. в России и Франции с носителями соответственно русского и французского языка, который был сориентирован на предметную область “Информатика и вычислительная техника”.

Об эксперименте

Методика проведения ассоциативного эксперимента стандартна. Эксперимент проводится в виде письменного опроса (анкетирования). Испытуемому предлагается список слов-стимулов (как правило, не больше 100). Он должен ответить на каждое слово-стимул, не задумываясь, первым приходящим в голову словом (словом-реакцией).

Для выделения понятий, характеризующих предметную область “Информатика и вычислительная техника”, был взят корпус текстов статей разных авторов, опубликованных в годовой подборке журналов “Computer Week” за 1995 г. [3].

Из них были сформированы три списка стимулов. Первые два - для опроса русскоязычных респондентов (специалистов и неспециалистов). Специалисты - испытуемые, имеющих профессиональный уровень знаний в области информатики и вычислительной техники (студенты компьютерных специальностей). Неспециалисты - студенты других специальностей (“пользователи” компьютерной техники). На основе перевода с русского языка на французский большинства стимулов второго списка был получен третий список для “французского ассоциативного эксперимента”, который проводился с неспециалистами.

Эксперимент 

Количество

Русский 

Французский 

1-ый список специалисты

2-ой список неспециалисты

3-ий список неспециалисты

стимулов (всего)

253

128

118

стимулов в каждой анкете

100

100

60

опрошенных (анкет)

126

111

113

разных ассоциативных пар

7331

5328

3906

разных реакций

4057

3318

2459

Частота предложения стимула

от 43 до 53

от 74 до 95

от 55 до 71

Таблица 1. Основные характеристики специализированного ассоциативного эксперимента

Испытуемыми были студенты следующих высших учебных заведений: МГТУ — Московский государственный технический университет им. Н.Э. Баумана, МГУП — Московский государственный университет печати и ECL — Ecole Centrale de Lyon (Высшая инженерная школа, г. Лион, Франция).

Полученные результаты подготовлены к изданию в виде книги: Ю.Н.Филиппович, Д.Дельфт, Г.А.Черкасова. “Ассоциации информационных технологий: эксперимент на русском и французском языке” (М., 2001), включающей:

  • Список русских слов-стимулов. Технические специальности.
  • Русско-французский список слов-стимулов. Другие специальности.
  • Русский ассоциативный словарь информационных технологий: “стимул – реакция”. Технические специальности.
  • Русский ассоциативный словарь информационных технологий: “стимул – реакция”. Другие специальности.
  • Французский ассоциативный словарь информационных технологий: “стимул – реакция”. Другие специальности.
  • Связи слов-стимулов
  • Список связей русских слов-стимулов (технические специальности).
  • Список связей русских слов-стимулов (другие специальности).
  • Список связей французских слов-стимулов (другие специальности).
  • Автоматический перевод списка связей французских слов-стимулов.

Анализ полученных данных

Полученные материалы представляют собой широкое поле для дальнейшего изучения. Некоторый анализ полученных в ходе эксперимента данных представлен в статье Черкасовой Г.А.[1]. В рамках данной статьи предлагается сравнить ассоциативные дефиниции с соответствующими им семантическими (определением).

Сравнение можно провести среди специалистов и неспециалистов в предметной области информатики и вычислительной техники. Вполне резонно предположить, что ввиду профессиональных навыков специалисты ассоциируют то или иное понятие (слово стимул) с его семантическим значением (определением). Неспециалисты воспринимают это понятие более на повседневном уровне или вообще не знают значения слова. Об этом, к примеру, свидетельствует большое количество отказов от ответа на слово-стимул среди неспециалистов 14,81% - от общего количества ответов [1]. В связи с такой постановкой проблемы можно оценить профессиональные знания специалиста. То есть, проводя ассоциативный эксперимент и сравнивая реакции испытуемого на те или иные термины с их семантическим значением, можно оценить его профессиональные навыки.

В рамках нашего эксперимента мы попытаемся оценить профессиональные знания студентов компьютерных специальностей (специалистов), сравнивая их со знаниями студентов других специальностей (неспециалистов).

Для начала рассмотрим подробно саму идею сравнения. Возьмем какое-нибудь слово-стимул. Его ассоциативное поле (ассоциативная дефиниция) состоит из перечня слов-реакций (ассоциаций) на это слово и с соответствующими частотами встречаемости. В данном случае не будем учитывать частоту встречаемости слова-реакции. Тогда ассоциативная дефиниция рассматриваемого слова-стимула будет состоять только из перечня слов-реакций. Теперь из толкового словаря возьмем определение слова-стимула - семантическую дефиницию [4]. Естественно, что толкование данного слова состоит из связанного текста, а не из простого перечня слов. Поэтому необходимо преобразовать толкование слова в набор ключевых слов, выбросив при этом предлоги, союзы и т.п. Но теперь мы сталкиваемся с проблемой словоформ. Поэтому необходимо провести лемматизацию всех ключевых слов - т.е. привести их к основной форме. Аналогично нужно поступить и с ассоциативной дефиницией.

В качестве меры связи будем рассматривать наличие слова в списке реакций ассоциативного поля и списке ключевых слов семантического поля. Но количество ключевых слов в семантических полях различных слов могут быть разными. Поэтому мера связи будет определяться в процентном соотношении. То есть, если семантическое поле слова состоит из 10 слов. А в обоих списках оказалось 5 одинаковых слов, тогда мера связи семантической и ассоциативной дефиниции данного слова составит 50%. Расчет проведем для 20 произвольных слов-стимулов из общего списка для специалистов и неспециалистов. Для примера рассмотрим слово: байт (byte).

Толкование:

Байт (byte) - единица данных, которую принимают за равную 8 битам, для одного знака ANSII может служить один байт.

Ключевые слова толкования: единица, данные, принимать, равный, 8, бит, один, знак, ANSII, может, служить, байт.

Стимул

Кол-во слов толкования

Кол-во общих слов

Мера связи

неспец.

спец.

неспец.

спец.

Архив 10 3 2 30 20
Байт 2 4 5 33,33 41,66
Бит 8 1 3 12,5 37,5
Винчестер 19 3 2 15,78 10,52
Вирус 13 2 1 15,38 7,69
Дpайвеp 7 1 1 14,29 14,29
Данные 8 2 2 25 25
Джойстик 8 0 1 0 12,5
Диск 4 4 2 100 50
Дисплей 9,1 1 1 11,11 11,11
Компьютер 10 3 1 30 10
Модем 7 4 4 57,14 57,14
Монитоp 9 1 1 11,11 11,11
Пиксел 7 2 4 28,57 57,14
Принтер 6 3 2 50 33,33
Процесcор 5 1 2 20 40
Растр 16 4 4 25 25
Сервер 7 2 4 28,57 57,14
Трекбол 9 0 1 0 11
Хакер 19 1 6 5,26 31,57

Таблица 2. Расчет меры связи семантических и ассоциативных дефиниций

Среднее значение меры связи для специалистов (28,1905) больше, чем для неспециалистов (25,6515), но разница весьма мала. Мера связи специалистов больше меры связи неспециалистов для 8 слов, меньше - для 6 слов и равна - для 6 слов из 20 слов-стимулов.

В результате проведенного эксперимента оказалось, что разница знаний в области "Информатика и вычислительная техника" у специалистов и неспециалистов в связи с поставленной проблемой не велика. Об этом свидетельствует небольшая разница между мерами связи. Однако судить об этом трудно, так как оценка была очень груба. Возможно также, что этот результат вызван другой причиной, заключающейся в ошибочности самого предположения о возможности оценки профессионализма с помощью предложенной схемы. Ввиду того, что мы имеем дело с ассоциацией (то есть с первым пришедшим на ум словом) вполне логично предположить, что она по своей сути более повседневна. Ассоциация отражает некое общее представление о том или ином понятии в обществе, зачастую даже ошибочное. Она характеризует знание о том или ином предмете на повседневном уровне, а не на профессиональном. В любом случае для более точного результата необходимо значительное усложнение меры связи, и возможно пересмотр некоторых концепций составляющих основу анализа ( по крайней мере в контексте оценки профессионализма).

Литература

1

Русский ассоциативный словарь. Прямой словарь: от стимула к реакции. Ассоциативный тезаурус современного русского языка. /Ю.Н.Караулов, Ю.А.Сорокин, Е.Ф.Тарасов, Н.В.Уфимцева, Г.А.Черкасова. М.: «Памовский и партнеры», 1994-1998.

2

Ассоциации информационных технологий: эксперимент на русском и французском языках. /Ю.Н.Филиппович, Д.Дельфт, Г.А.Черкасова. М.: Изд-во МГУМ, 2001.

3

А.В.Прохоров. Методика построения семантических ареалов в естественно-языковом описании предметной области // Интеллектуальные технологии и системы. Сборник статей аспирантов и студентов. Выпуск 2 / Сост. и ред. Ю.Н.Филипповича. М.: Изд-во МГУМ, 1999. 304 с.

4

Синклер А. Большой толковый словарь компьютерных терминов. Русско-английский, англо-русский. М.: Вече, АСТ, 1999. 512 с.

 

   

CLAIM - научно-образовательный кластер it-claim.ru
Все вопросы и комментарии вы можете отправлять по адресу: anna@it-claim.ru