Маркес и Кортасар

Почему мне не нравится Маркес, и при этом нравится Кортасар.
Действительно, на первый взгляд, это очень похожие писатели: оба латиноамериканцы, середина XX века, Кортасар – Аргентина, Маркес – Боливия, если я не путаю. У обоих своеобразный стиль с некоторым налетом фантастики – не фантастики, но чего-то магического.
В чем же разница?

Collapse )

Научное устройство идеального общества

Пусть есть абстрактная задача: есть большое государство (возможно, всемирное), хотелось бы устроить его рационально, комфортно для жителей и во всех отношениях наилучшим образом.

Возникает масса вопросов:

Какой строй выбрать? Монархия, олигополия, демократия?

Collapse )

Паблики в вк

В вк увидел картинку в паблике Лепра, куда частенько заглядываю: “дочь секретаря избирательной комиссии в ходе ДТП сбила одну девушку насмерть, одну искалечила, после чего была освобождена от наказания, ее признали неимущей”.
Collapse )

Хадлей Викхам. Упорядоченные данные. 6 из 6

Оригинал взят у nasurdinov_ms в Хадлей Викхам. Упорядоченные данные. 6 из 6
Шестая и последняя часть перевода статьи Хадлея Викхама.
6. Обсуждение

Очистка данных является важной проблемой, однако этот предмет редко обсуждается в статистике. Данная работа обозначает  небольшой, но важный подраздел очистки данных, который я называл упорядочиванием данных: структурированием массива данных для облегчения манипуляции, визуализации и моделирования. Впереди все еще много работы. Пошаговые улучшения происходят по мере того, как улучшается наше понимание упорядоченных данных и упорядоченных инструментов, и по мере того, как мы улучшаем нашу способность снижать затраты при переводе данных в упорядоченную форму.

Collapse )

Хадлей Викхам. Упорядоченные данные. 5 из 6

Оригинал взят у nasurdinov_ms в Хадлей Викхам. Упорядоченные данные. 5 из 6
Пятая часть перевода статьи Хадлея Викхама.

R> ggplot(data = devi, aes(x = n, y = dist) + geom_point()
R>
R> last_plot() +
R> scale_x_log10() +
R> scale_y_log10() +
R> geom_smooth(method = "rlm", se = F)
Collapse )

Хадлей Викхам. Упорядоченные данные. 4 из 6

Оригинал взят у nasurdinov_ms в Хадлей Викхам. Упорядоченные данные. 4 из 6
Четвертая часть перевода статьи Хадлея Викхама.

4.3. Моделирование
Моделирование является вдохновляющей идеей данной работы, потому что большинство инструментов для моделирования лучше всего работают с упорядоченными массивами данных. Каждый статистический язык содержит способ описания модели как соединения различных переменных – предметно-ориентированный язык, который связывает реакции (responses) с предсказывающими переменными (predictors):
Collapse )

Хадлей Викхам. Упорядоченные данные. 3 из 6

Оригинал взят у nasurdinov_ms в Хадлей Викхам. Упорядоченные данные. 3 из 6
Третья часть перевода статьи Хадлея Викхама.

Таблица 11. Исходный массив данных по погоде. Существует столбец для каждого возможного дня в месяце. Столбцы d9 – d31 не показаны для экономии места
Collapse )

Хадлей Викхам. Упорядоченные данные. 2 из 6

Оригинал взят у nasurdinov_ms в Хадлей Викхам. Упорядоченные данные. 2 из 6
Продолжаем публикацию статьи Хадлея Викхама.

Данный массив данных содержит три переменные: религия, доход и частота. Для их упорядочивания мы должны «расплавить», или сложить их стопкой. Иными словами, мы должны обратить столбцы в строки. В то время как это часто описывается как переделывание широкого массива данных в длинный или высокий, я буду избегать этих терминов, т.к. они неточные. Плавление характеризуется списком столбцов, которые уже являются переменными, или «колвар» (colvar, column variable – в буквальном переводе «столбцовая переменная» - прим. перев.), для краткости. Другие столбцы обращаются в две переменные: новая переменная, называемая «столбец», содержащая повторяемые имена столбцов и новая переменная, называемая «значение», содержащая сцепленные значения данных из предварительно разделенных столбцов. Это проиллюстрировано в таблице 5 с помощью шуточного массива данных. Результатом плавления является «расплавленный» массив данных.

Collapse )