политика

О боевой революционной социологии

Я не люблю писать о политике, 10G ethernet или цифровое фото - гораздо интереснее.

Но тут, волею судеб, довелось 10 минут поанализировать данные правильного, настоящего опроса населения (попросили, я и посмотрел), не пропадать же добру.

В интернете (и, в частности, соцсетях) последние дни активно пиарится общественный опрос общественного же мнения (в соцсетях преимущественно ссылаются на сайт эха, сошлюсь и я). Согласно этим данным, рейтинг Путина сильно преувеличен, "Шансы Путина на победу в первом туре равны нулю", и так далее.

По счастью, это тот же самый опрос, "Гражданина Социолога", для которого доступны первичные данные по ряду городов. Список городов совпадает, количество респондентов совпадает, все совпадает.

Давайте посмотрим на них повнимательнее.

Мастера художественного передергивания

Очень трудно удержаться и вообще ничего не писать о политике. Вот опять не получилось.

Вот есть свежий опрос Левады. Всех, понятно, интересуют предстоящие выборы, там эта тема раскрыта двумя способами:

  • Открытый список, хоть Дарта Вейдера вписывай. По этому методу у Путина 37% поддержки (проголосовал бы за него в ближайшие выходные) от населения, у Зюганова ( 2) - 8%. А 41% населения тем или иным способом затруднился с ответом.
  • Закрытый список, проценты только от определившихся: 63% запутина, 15% зазюганова.
Дальше пресса начинает об этом писать. Ну, понятно, что 8 против 37, что 15 против 63 - разные весовые категории, и там и сям 4.5 раза. Поэтому мастера журналистики для Пу берут цифирку из первой таблички (поменьше), а для Зю - из второй (побольше).

Отличились:

Молодцы, че. В борьбе за правое дело и передернуть не грех. А если вдруг Пу наберет over 50 (или 60) в первом же туре (что, согласно результатам вышеупомянутого опроса, вполне вероятно) - массовка будет заранее знать что все подтасовано, ибо соцопросы давали 37%

О Нумерологии - продолжение

После моего предыдущего разоблачения гребенок Чурова армянское радио спрашивают мне пишут, по смыслу примерно такое:

Алексей, а почему вы взяли ширину бина (ячейки гистограммы) 0.1%, там же будет сплошной шум, на фоне которого ничего не видно. Открыватели гребенки Чурова брали 0.5% и у них все получилось, а пика на 66.7% - наоборот, не получилось.

Отвечаем:

I. Я, собственно, ловил именно пик на 2/3 (66.66(6)%), как имеющий (скорее всего) естественное происхождение, потому и взял такой бин.

При ширине бина гистограммы в 0.5% поймать пик на 66.7% очень трудно, ибо и сам пик на 66.7 и провалы перед ним и после него на 66.5, 66.6, 66.8 и 66.9 попадут в один бин гистограммы и взаимоуничтожатся. Потому то у открывателей гребенки и не получилось пика на 66.7.

II. Но я не гордый, данные с бином 0.1 уже в Экселе, их можно просто поскладывать по 5 штук и получить гистограмму с бином 0.5. Вопрос только в том, как располагать бины гистограммы, ведь есть варианты:

  1. "Надпись - слева от бина". Т.е. бину "50%" соответствует диапазон 50.0%-50.49(9)%. Это - обычный способ построения гистограмм и, скорее всего, "гребенка Чурова" получена именно так.
  2. "Бин - слева от своей надписи". Т.е. бину 50% точно отвечают значения от 49.5000(0)1 до 50.0.
  3. "Надпись - посередине бина". Т.е. бин "50%" охватывает диапазон, скажем, от 49.8 до 50.29(9) (лучше было бы от 49.75 до 50.249(9), симметричнее, но у меня исходные данные уже насчитаны с шагом 0.1 и быстро так не сделать).
Я, повторяю, не гордый и опробовал все три способа. И вот что получилось для диапазона 45-55% голосов за ЕР:

О Нумерологии

Количество дискуссий "о статистике" в которых я тут, сдуру, участвую, начинает меня нервировать. Хочу записать основные тезисы, дабы потом просто давать ссылку, а не писать одно и то же десять раз.

Предуведомление

Для создания хоть какой-то конструктивной атмосферы в обсуждении, вынужден сообщить:

  1. Я никоим образом не пытаюсь оспорить наличие фальсификаций на прошедших выборах о чем просто утомился уже говорить. Есть участки, где просто йобаный стыд, есть зафиксированные расхождения между копией протокола у наблюдателя и сайтом ЦИК (и эти расхождения, как правило, за одну партию), есть всякие подозрительные случаи, когда наблюдателя выгнали, а на сайте ЦИК что-то абсолютно не похожее на результаты по соседним участкам.
  2. Вышесказанное не означает, что любая странность должна трактоваться против Чурова и ЕР.
  3. Вышесказанное не означает, что любая наукообразная аргументация от противников Чурова/ЕР должна восприниматься некритически.
  4. Ну и если мы про статистическую науку, так давайте действовать как-то наукообразно, а не кто кого громче заклеймит и перекричит.
Чувствую себя полным идиотом оправдываясь, но без подобной преамбулы дискуссия сводится, в пределе "не надо оправдывать фальсификации, путинский наймит". А я скорее о том, что фальсификации не должны разоблачаться с помощью неподходящего к ситуации (или неправильно употребленного) статистического аппарата. То есть, конечно, все имеют право на заблуждения, но ситуация, когда на заблуждения указываешь, а в ответ получаешь ругань (обвинения в проданности режиму и прочее подобное) - огорчительна мне.

О Гауссиане и Центральной Предельной Теореме

О гауссиане

А еще в текущем моменте меня удивляет, с каким энтузиазмом образованные люди пересылают друг другу ссылки про математическое доказательство существования диавола гауссиану известно в каких графиках.

Ну включите ум, ну откуда там гауссиане взяться?

Update (для тех кому лень задуматься):

  1. Гауссиана симметрична, т.е. неправильно (для статистики по выборам) ведет себя, к примеру, около нуля. Ну вот допустим есть партия А со средним по стране 3% и выплесками до 10%. Столько, сколько выплесков на +7, столько же должно быть и на -7. Т.е. до -4%.
  2. Логнормальное распределение ведет себя приемлемо около нуля, но опять будут выплески "за 100%", причем они будут в логарифмах т.е. по величине - гигантские.
  3. На взгляд, не похоже, что можно подобрать такие ~10 гауссиан (7 партий + испорченые + потеряли + что еще там бывает), чтобы их сумма в каждом участке была бы ровно единицей (100%).
  4. Распределения с несколькими пиками вполне могут быть, если есть несколько социальных групп, голосующих сильно по-разному. См. Израиль.
Да, я не пытаюсь опровергнуть (или доказать) приписки, нечестный счет и все такое. Просто гауссиана к этому месту гарантировано неприменимма.

Update: продолжение тут

О текущем моменте

Я не писал в этом блоге о политике раньше и надеюсь, что не буду писать и впредь. Но происходящее ровно сейчас меня тревожит, и не высказаться я не могу.
  1. Я могу понять тех, кто попытался высказать ИМ ВСЕМ путем голосования, а на следующее утро обнаружил чудеса на сайте избиркома на своем участке. Насрали на голову лично вам, причем непонятно зачем: 4 лидера избирательного процесса если и не разлиты из одной бочки, так разлиты из очень похожих.
  2. Остается судиться (что скучно, долго, результат не гарантирован, да и участников у этого процесса не так много), или выйти на площадь и таки высказать ИМ ВСЕМ и показать что .
  3. Во всем этом тревожат только такие вот неприятные мелочи:
    • Fox News УЖЕ показывал московские беспорядки с чем-то горящим на фоне знаменитых московских пальмовых бульваров.
    • Стихийно придуманный в последние дни брэндбук революционера (название, ленточка нужного цвета и все что там полагается) ВНЕЗАПНО имеет домен и ЖЖ-community зарегистрированные полтора-два месяца назад. Готовились люди, ничего нельзя пускать на самотек.
    • Стандартный стихийный цветной сценарий борьбы за свободу это повышение градуса противостояния до бесконечности. Иначе ничего не выйдет. С трупами если без них не получается.
    • Задача организаторов стихийного протеста вовсе не разумный компромисс.

Собственно, я и призываю своих читателей включить голову (вместо эмоций) и задуматься, какую цену лично вы готовы заплатить и, кстати, за что. Примеров цветных революций можно найти в недавней истории в количестве.

P.S. Это призыв включить голову и сделать как велит она, а не остальные органы, места для дискуссии не вижу.

Subscribe to политика