MachineLearning:Категоризация
Материал из MachineLearning.
Категоризация — это процесс структирования схожих статей по темам. Категории (наряду со списками, обзорными шаблонами и др.) помогают читателям находить информацию, даже в тех случаях, когда они не знают, как искомая тема называется, или сомневаются в том, что она вообще присутствует на страницах Ресурса. Сами категории внешне представляют из себя оглавления, где их содержание отсортировано по алфавиту.
Категоризация должна помогать читателям ориентироваться в материалах Ресурса. При этом количество категорий для отдельных статей должно быть разумным и оправданным. Названия категорий должны быть нейтральными и узнаваемыми.
Содержание |
Добавление статьи в категорию
Статья из любого пространства имён может быть включена в любую категорию путём добавления тега-ссылки на страницу категории, образованного добавлением к имени категории ключевого слова Категория:, например:
[[Категория:Классификация]]
Это соответствует ссылке на соответствующую страницу категории, располагающуюся в пространстве имён категорий.
Страница может быть внесена больше чем в одну категорию — нужно просто добавить несколько тегов. При просмотре отредактированной страницы эти ссылки отображаются не в основном тексте, а на полях страницы, в позиции, жёстко заданной используемой темой оформления (внизу при использовании Monobook, справа вверху — при использовании Стандартное). В противоположность автоматической сортировке списков категорий (см. ниже), список категорий на странице располагается в порядке следования соответствующих тегов.
Общие положения
Категории как один из ключевых способов организации информации Ресурса следует добавлять ко всем типам страниц, но при этом есть некоторые ограничения по форме и обьёму категоризации.
Для статей
Статьи являются основным содержанием Ресурса и грамотная категоризация очень важна для них. Наличие хотя бы одной категории в статье обязательно, по нескольким причинам: во-первых, это чуть ли не единственный способ найти информацию, не зная, как называется искомая статья, во-вторых, это значительно ускоряет внесение статьи в индекс поисковых систем, что опять увеличивает доступность статьи для читателей, ну и в-третьих, категоризация сама по себе — очень удобный способ структурирования, организации просмотра и поиска информации.
При этом есть определённые ограничения на количество категорий, в которые может быть внесена статья. Следует использовать наиболее конкретные категории. Если статья подходит по смыслу для категории А и её подкатегории Б, то её, как правило, следует включать только в Б. Исключением может быть тот случай, когда статья значима и для всей категории А (как правило, это обзорные статьи).
Страница категории
Новые категории могут быть созданы и исправлены так же, как и обычные страницы,
Страница категории состоит из нескольких частей:
- текст описания, который может быть отредактирован так же как и любая другая страница;
- автоматически создаваемый список подкатегорий и их количество; если подкатегории отсутствуют, то данный раздел не отображается;
- автоматически создаваемый список страниц, включённых в данную категорию, кроме подкатегорий и изображений; их количество, называемое «числом статей»; если категория пуста, то отображается заголовок и строка «Категория пуста»
- автоматически создаваемый список изображений с картинками предпросмотра (подсчёт количества не ведётся); если имя изображения длиннее 20 символов, оно обрезается и дополняется троеточием; в отличие от второй и третьей секции, рубрикации по первым буквам имени не происходит; также отсутствует подзаголовок, отделяющий этот раздел от раздела статей.
Данные списки содержат только ссылки на соответствующие страницы, для изображений даётся также ссылка на страницу описания.
Для подкатегорий
Если страница, внесённая в категорию, сама является категорией, она образует подкатегорию.
Например, вы можете редактировать Категория:Конференции и добавить в неё ссылку на Категория:Мероприятия. Категория «Конференции» станет подкатегорией категории Мероприятия».
Если для статей основополагающее правило «если что-то существенное в статье относится к теме такой-то категории, то статью следует поставить в эту категорию», то для подкатегорий правила несколько иные.
Подкатегории следует подбирать так, чтобы во всём дереве каждой категории не было ни одной статьи, которая к ней не относится. Таким образом, категория А может стать подкатегорией в категории Б только в том случае, если все её статьи и подкатегории всех уровней не выходят за рамки категории Б.
«Красные» категории
Наличие «красных» (ещё не созданных) категорий в статье в общем случае не является причиной их удаления. Причинами удаления категорий (как уже существующих, так и «красных») из статьи могут являться:
- ошибки в названии категории или несоответствие принятым стандартам именования категорий в данном разделе — такие названия должны исправляться (не обязательно на уже существующие категории)
- несоответствие названия категории тематике статьи
- наличие более узкой категории в данной ветке, более точно соответствующей тематике статьи — в этом случае категория уточняется.
- наличие в статье одновременно более общей и более узкой категорий из одной и той же ветки — в этом случае более общая категория из статьи удаляется.
Во всех остальных случаях категория должна быть оставлена.
Сортировка в категориях
Как уже было сказано выше, статьи в категориях сортируются в алфавитном порядке.
Порядок сортировки
Порядок сортировки в категориях идёт в соответствии с ASCII:
./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_'abcdefghijklmnopqrstuvwxyz{|}~
Пробел находится в начале данной последовательности. Буквы кириллического алфавита располагаются после данной последовательности и сортируются в соответствии с юникод-кодами:
АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯабвгдежзийклмнопрстуфхцчшщьыъэюяЁё
Ключ сортировки
Для сортировки статей в категориях используются ключи сортировки. Есть два способа сортировки при помощи ключей:
- Добавление {{DEFAULTSORT:ключ сортировки}} устанавливает ключ сортировки по умолчанию для всех категорий, в которую входит статья;
- Добавление, [[Категория:Название категории|ключ сортировки]] в статье устанавливает сортировку для отдельно взятой категории.
Нет необходимости использовать ключ сортировки в тех случаях, когда название статьи состоит из одного слова, а также тогда, когда первое слово в заголовке и является ключевым.
Иногда требуется вынести статью в самое начало категории (как например в случае с обзорной статьёй) — для этого используйте специальный ключ сортировки, например, знак пробела или «*»: «[[Категория:Имя категории| ]]» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел).
Конкретные особенности
Большинство статей не требуют использования ключа сортировки, к тем же которые требуют, следует подходить с осторожностью. Прежде чем вставлять ключ сортировки, следует спросить себя, на какую букву средний человек обычно станет искать ту или иную статьи, и только выяснив этот вопрос, можно приступать к действиям.
Служебные страницы
- Дерево категорий
- Все категории
- Категории, на которые больше всего ссылок
- Неиспользуемые категории
- Некатегоризованные категории
- Страницы, включённые в большое количество категорий
- Требуемые категории