[personal profile] conceptualist
Первая диаграмма изображает Тверской район, где я живу. У Собянина в этом районе 41,54%.
Гауссиана - Тверской район

Вторая диаграмма изображает район Выхино-Жулебино, самый многолюдный в Москве. Здесь у Собянина 59,51%.
Гауссиана - Выхино-Жулебино

Третья диаграмма изображает Новомосковский административный округ, где у Собянина, по официальным данным, самая высокая поддержка - 69,48%.
Гауссиана - Новомосковский округ

График Тверского района слишком гладкий, потому что там относительно мало избирательных участков - всего 23. Тогда как в Выхино-Жулебино их 60, а в Новомосковском округе - 71. Надо, видимо, нарисовать еще несколько штук по разным районам. Тогда будет понятнее, как выглядит норма, а как аномалия.

Date: 2013-09-10 07:25 pm (UTC)
From: [identity profile] avaxhomedotru.livejournal.com

Да что там рисовать – и так всё ясно.

З.Ы. Я сам, кстати, из Тверского района тоже.

Date: 2013-09-10 08:21 pm (UTC)
From: [identity profile] gavagay.livejournal.com
ООООООО, какая знакомая картинка по Новой Москве! Узнаю, узнаю брата Колю!

Date: 2013-09-10 08:50 pm (UTC)
From: [identity profile] inquisi-tor.livejournal.com
Валера, объясни для тупых, пожалуйста, что отложено по осям и что это за плотность вероятности?

Date: 2013-09-10 09:17 pm (UTC)
From: [identity profile] conceptualist.livejournal.com
Плотность вероятности - вот эта:
http://ru.wikipedia.org/wiki/%D0%9F%D0%BB%D0%BE%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F

По горизонтальной оси у нас процент голосов за Собянина в нарезке по одинаковым маленьким интервалам. По вертикальной - доля участков, где у Собянина соответствующий процент голосов, от общего числа участков.

Date: 2013-09-10 11:20 pm (UTC)
From: [identity profile] inquisi-tor.livejournal.com
С осями я разобрался. Только теперь я не понимаю, причем тут вероятность и ее плотность.
Судя по тому, что ты мне написал, на графиках изображен график, показывающий зависимость доли участков от кол-ва процентов голосов. Т.е. по сути это, с точки зрения теории вероятности, простая статистика.

Date: 2013-09-10 11:34 pm (UTC)
From: [identity profile] conceptualist.livejournal.com
У нас есть диапазон значений случайной переменной. Например, от 40% до 41%. Еще есть, допустим, сто случаев, когда эта переменная принимала какие-то значения. Из этих ста случаев три раза она попадала в интервал между 40% и 41%. Поэтому можно сказать, что вероятность значения в этом промежутке - три сотых.

Date: 2013-09-11 02:16 am (UTC)
From: [identity profile] inquisi-tor.livejournal.com
Более или менее понятно. Спасибо.

Date: 2013-09-11 04:23 am (UTC)
From: [identity profile] e2pii1.livejournal.com
А в чем там проблема ? Вроде не видно никаких аномалий (участков ведь всего 71).

Date: 2013-09-11 08:58 am (UTC)
From: [identity profile] bacchusv.livejournal.com
Какой шаг-то? И вообще, это строить бы гистограммой, а не сглаженным графиком.

Date: 2013-09-11 09:01 am (UTC)
From: [identity profile] conceptualist.livejournal.com
Шаг - один УИК. Гистограммы я тоже делал, но так выглядит эффектнее.

Date: 2013-09-11 09:02 am (UTC)
From: [identity profile] conceptualist.livejournal.com
Вернее, не один УИК, а 1/х, где х - количество УИКов в районе.

Date: 2013-09-11 09:21 am (UTC)
From: [identity profile] bacchusv.livejournal.com
Переформулирую вопрос — какой отрезок в процентах брался, чтобы посчитать сколько УИКов в него попадает и понять какое число надо делить на общее, чтобы получить "вероятность". Судя по графикам, это два процента?

Также, если что, истинная (ну, сгенерированная Экселем) гауссиана со средним значением 69.48% и средним отклонением в 6% может выглядеть так, это я получил при первой же генерации:


Причем "эффектность" тут достигается именно методом построения, в гистограммах понятно, что оно и выглядит примерно как должно бы.

В общем, даешь тест по хи-квадрату.

Date: 2013-09-11 09:28 am (UTC)
From: [identity profile] bacchusv.livejournal.com
О, на третьей генерации с сидом 2236, получил нечто уж совсем похожее, пик бы на 72 процентах чуть поменьше:

Date: 2013-09-11 09:29 am (UTC)
From: [identity profile] conceptualist.livejournal.com
На разных графиках эти отрезки разные. В Тверском районе 1/23, в Выхино-Жулебино 1/60, в Новомсосковском округе 1/71. То есть в первом случае около 4%, а во втором и третьем - меньше 2%.

Date: 2013-09-11 09:31 am (UTC)
From: [identity profile] conceptualist.livejournal.com
Попробуй получить плато на уровне 75-80.

Date: 2013-09-11 09:59 am (UTC)
From: [identity profile] bacchusv.livejournal.com
Это глупое занятие сидеть и перебирать гауссианы, тем более можно аналитически посчитать какова вероятность того, что при заданном шаге и распределении в прилежащие отрезки попадёт +/- один участок. Это тоже несколько муторно и я сейчас этого делать не буду, но на вскидку там вероятность далекая от аномальной. "Плато" твоё формируется на отрезке, кажущимся большим, аж 5%, но по сути это всего две-три точки.

Каков резон в такой странной методике выбора шага я не понял. Для того чтобы графики были сравнимы шаг в любом случае должен быть одинаков или хотя бы примерно одинаков, иначе ожидаемо же что графики с более широким шагом будут более гладкими.

В общем, сделай просто проверку по хи-квадрату и будет тебе счастье, узнаешь насколько именно ожидаемо получить графики отличающиеся от гладенькой гауссианы, настолько насколько отличаются твои.

Date: 2013-09-12 07:02 pm (UTC)
From: [identity profile] gruz4ik.livejournal.com
Смотрю как баран на новые ворота на эти линии и на комментарии к посту. Смутно подозреваю, что между этими линиями, выборами, и комментариями есть некая сложная причинно-следственная связь.

Profile

conceptualist: (Default)
conceptualist

December 2020

S M T W T F S
  12345
6789101112
131415 161718 19
20212223242526
2728293031  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 10th, 2026 09:41 pm
Powered by Dreamwidth Studios