Рекомендуемая литература. Упражнения.
Как отмечалось в самом начале этой главы, существует множество проблем, связанных с машинным обучением, о которых мы даже не упоминали в данной книге. Читателям, которые заинтересуются этой проблемой, я бы порекомендовал начинать знакомство с ней с обзоров [Michalski et al, 1983] и [Michalski et al., 1986] и работы [Winston, 1984, Chapter 11]. В этих статьях рассматриваются разнообразные виды машинного обучения, приложимые не только к экспертным системам.
Множество статей на эту тему публикуется в журнале Artificial Intelligence. В частности, я рекомендую познакомиться со статьями [Winston, 1982J и [Lenat, 1982]. Классификация программ обучения, основанная на анализе базовых алгоритмов, представлена в работе [Bundy et al., 1984]. Но учтите, что эта статья предполагает предварительное знакомство с основными концепциями работы систем, анализируемых в ней. Сравнительные анализ существующих систем можно найти также в работах [O'Rourke, 1982] и [Dietterich and Michalski, 1983].
Из поздних работ я бы отметил статью [Buchanan and Wilkihs, 1993], в которой вы найдете много информации о современном состоянии проблемы извлечения знаний и машинного обучения. Довольно подробное описание системы С4.5 представлено в [Quintan, 1993], причем в описание включены и листинги программ. Пространство версий рассматривается в книге [Mitchell, 1997, Chapter 2].
Упражнения
Упражнение 1
В чем отличие методик супервизорного обучения и "обучения без преподавателя"?
Упражнение 2
Проведите разграничение между задачами "обучение концептам" и "обобщение дескрипторов".
Упражнение 3
По образцу, приведенному в тексте главы, постройте обучающую выборку для следующих концептов:
I) иностранная машина.
II) маленькая иностранная машина.
III) маленькая американская машина.
Как вы думаете, можно ли использовать в обучающей выборке для концептов II) и III) те же экземпляры, что и представленные в табл. 20.1?
Упражнение 4
На рис. 20.4 показаны три пары образцов. Скажите, во всех ли парах имеются более и менее специфические образцы, а если это так, то какой именно из них является более специфическим.
Упражнение 5
Рассмотрите обучающую выборку, представленную в табл. 20.2. Из 14 объектов 9 относятся к классу П, а 5 – к классу Н. Следовательно, энтропия множества сообщений будет равна: -(9/14)log2(9/14) -(5/14)*log2(l/J4) = 0.94 бит.
Рис. 20.4. Пары образцов
I) Чему равно ожидаемое количество информации для атрибута наблюдение?
II) Чему равен прирост количества информации после анализа атрибута наблюдение?
III) Повторите этот анализ по отношению к атрибутам влажность и ветрено.
IV) Анализ какого атрибута сулит наибольший прирост количества информации?
Упражнение 6
Перечислите несколько методик обучения, которые используются в практике работы с людьми, и постарайтесь разграничить эти методики по характеру. Например, методика обучения таблице умножения существенно отличается от методики обучения игре на музыкальных инструментах. Какая из методик легче всего реализуется программно и почему?