воскресенье, 24 августа 2014 г.

Visualize of changes position Univ and share indicators in Webometrics

А small exercise in visualization using Tableau's dynamic filtering.
The graph on the left shows the number of universities in the ranking of countries Webometrics Jul 2014 with dynamics of universities’ average positions in the country’s ranking as compared to Webometrics Jan 2014. Select a country to see a list of universities of this country in the graph below.
The graph shows the normalized deviation for each university and each indicator, calculated as the difference between the university rank based on this indicator only and overall university rank, multiplied by the indicator’s weight in the ranking and normalized (divided) by overall university rank.
The graph to the right shows average values ​​of this normalized deviation for each indicator.
Note that the sum of normalized deviations for all indicators for a university is not equal to zero, because the calculation is based on rank and not on value rating.

It's interesting that Russian universities AVG Impact is significantly worse than other indicators.


Full and interactive version visualize

воскресенье, 16 февраля 2014 г.

Об классификацию

Хочешь ввести классификацию в {анализе данных|проектировании схемы|разработке формы сбора данных} подумай зачем тебе классификация и какие значения будут в словаре. Проверочные вопросы: кто стейкхолдер, для чего стейкхолдер будет использовать классификацию, какие решения будут приниматься на основании классификации.

Например атрибут пол. Традиционно в базе: М и Ж (так нас учит ОК 018-95). Дальше включаем мозг, смотрим в ограничения и вспоминаем, есть неопределенное значение. Как следствие число мальчиков и девочек может быть меньше, чем число персон в базе.
В ISO/IEC 5218 неопределенность значений уже учтена, возможно четыре значения. В принципе неопределенность не так проста, для интересующихся выделяют 22 вариант неопределенных значений :) см отчет CODASYL.
В медицине в зависимости от специализации число полов еще больше (одно счастье неопределенности меньше).
Апофеоз наступает, как только начинаем учитывать психологию восприятия пола массовым пользователем, 58 вариантов в  Facebook.

Что важно в классификации после осознания, что если мы не знаем цели, то классификации бессмысленны? Возможность отнесения одного элемента одновременно к нескольким группам одной классификации. Например, журнал Scientometrics входит в три подобласти одновременно, так как подобласти наукометрии нет. Почему так происходить, можно понять если осознать две вещи: разницу между понятиями type и kind (см [2]) и невозможность естественных классификаций (ссылку на Шарова и Юдина искать лень).

Итог: если не хочешь думать, выбирай международные классификации.

Дополнительное чтение:
1. Почитай про автоматизацию по мотивам нормативных актов и коменты
2. Прочитай Джордж Лакофф Женщины, огонь и опасные вещи. Что категории языка говорят нам о мышлении и подумай, что деревья классификаций растут из структур мозга (ссылок на психосемантику давать не буду).

Текст начинает серию под лозунгом: "что совой об пенек что пеньком об сову, все равно сове не жить".