Это было опубликовано в моем блог
Описательная аналитика обычно является первым шагом в упражнениях аналитики данных. Как называется, это описывает набор данных. Это отвечает на вопрос: « Что случилось ».
Любой набор данных может быть описано с участием:
- Сводные факторы, такие как среднее и режим;
- распределять факторы, такие как стандартное отклонение;
- Формы или факторы шаблона, такие как стандартное распределение.
Давайте поговорим с примером. Позвольте нам сказать, что приведены следующие данные по продажам для двух менеджеров по продажам за последние 6 недель:
- 43,41,42,46,41,41
- 32,34,68,62,28,30
Что эти номера говорят? Всего они оба продавали 254 предмета, что означает, что они оба одинаково конкурентны. Их среднее значение 42,3, что снова говорит, что они оба равны в калибре.
Стандартное отклонение красает другое изображение. Стандартное отклонение измеряет концентрацию данных вокруг среднего Отказ Стандартное отклонение для первого менеджера составляет 1,8, а второй составляет 16,2. Что это значит? Первый менеджер является последовательной неделей после недели в удовлетворении своей цели, но второй менеджер нет. Если все остальное остаются прежними такими же, то эти данные указывают на то, что первый менеджер по продажам является более надежно, чем второй.
Теперь давайте посмотрим на расчет этих описательных аналитиков для любого набора данных, используя JavaScript . Веб извлекается с учебниками Python, не большая часть JavaScript. Если разработчики уже используют Node.js для разработки веб-приложения или они используют JavaScript для проектирования разработки передней части, им не нужно использовать другой язык только для вычислительной статистики.
Мы будем использовать две пакеты для этой цели. Первый, Csvtojson , состоит в том, чтобы прочитать записи CSV и преобразуйте их в значения JSON. Второй, Простая статистика должен вычислить статистику. Обратитесь к Документация Для всех функций этого пакета. В этом посте мы используем только основные функции.
Простая статистика принимает массив значений и вычисляет статистику. Вычислительная сумма, среднее значение и стандартное отклонение для вышеупомянутых двух ценностей продаж идет так.
$ node
> const stats = require('simple-statistics');
> const first=[43,41,42,46,41,41];
> const second=[32,34,68,62,28,30];
> stats.sum(first)
254
> stats.sum(second)
254
> stats.mean(first)
42.333333333333336
> stats.mean(second)
42.333333333333336
> stats.standardDeviation(first)
1.7950549357115015
> stats.standardDeviation(second)
16.224124698183942
Слишком часто, когда мы изучаем предмет, мы получаем аккуратно расположенные примеры. Это как ходить в зоопарк . Но реальный мир сложен.
Недавно я проанализировал фигуры продаж для крупной компании электронной коммерции. Было около 150000 записей. Я не мог взглянуть через цифры, чтобы иметь смысл. Я загрузил все данные и проанализировал через простую статистический пакет. Это показало мне, насколько разные цифры продаж по сравнению с аккуратными докладывающими значениями, которые мы получаем во время обучения.
Вот код, который я написал, чтобы загрузить данные и описывать данные:
const csv = require('csvtojson');
const stats = require('simple-statistics');
let salesData = [];
let totalRows = 0;
const data = csv()
.fromFile('sales.csv')
.on('json', (jsonObj, rowIndex) => {
totalRows = rowIndex;
salesData.push(parseFloat(jsonObj['Sales'].replace(',', '')));
})
.on('done', () => {
descriptiveStats();
process.exit(1);
});
function descriptiveStats() {
console.log('descriptiveStats of ' + totalRows + ' rows');
console.log('Min: ', stats.min(salesData));
console.log('Max: ', stats.max(salesData));
console.log('Mean : ', stats.mean(salesData));
console.log('Median: ', stats.median(salesData));
console.log('Mode: ', stats.mode(salesData));
console.log('standardDeviation: ', stats.standardDeviation(salesData));
}
Результаты:
Min: -33116.58 Max: 70049.89 Mean: 316.117162163024 Median: 159.53 Mode: 0.01 standardDeviation: 777.6360644532846
Двигатель продаж полностью грязной для них. Каждый из описательного элемента статистики говорит только одно: в их продажах нет последовательности.
Хорошая книга, чтобы понять описательную статистику и в общем числах, от «экономиста», удачно под названием Руководство по номерам . Если вы хотите понять стандартное отклонение, прочитайте Понимание стандартного отклонения Отказ
Я буду продолжать писать о машинном обучении и аналитике данных с использованием JavaScript. Если это интересует вас, пожалуйста, подпишитесь от моего Блог Отказ
Оригинал: “https://dev.to/jjude/descriptive-analytics-in-javascript”