Из байесовской статистики к менеджерам продуктов проект машинного обучения имеет много предметов, и все они должны работать вместе, чтобы быть успешным. Ваша команда будет состоит из людей с различными специальностями, и это одна из вещей, которые делают машинное обучение так круто. В любое время что-то прохладно, бывает, люди идут немного сумасшедшие с ним, а команда учебных команд ничем не отличаются. Некоторые предприятия взяли на мысль, что если у них достаточно данных, они могут бросить команду на нее и получить невероятно ценные результаты.
Есть несколько компаний, которые идут до покупки огромных объемов данных, прежде чем они узнают, для чего они собираются использовать его. Машинное обучение – это не ответ на каждую проблему, особенно если вы не задаете правильные вопросы ваших данных. Чтобы убедиться, что у вас есть практическое понимание потока проекта машинного обучения, мы накроем пять основных шагов, которые вам нужно включить.
Решить, какую проблему решить
Наличие многих данных и надеясь, что что-то полезное выскакивает из него, не хорошая стратегия. Вы должны иметь конкретный вопрос, вы пытаетесь узнать больше или предсказать. Не покрывая этот первый шаг, вы могли бы потратить нецентное количество времени и денег, вращающихся колесами каждого. Машинное обучение, на данный момент, не «думает» в общих чертах. Вы можете бросить информацию на человека в течение всего дня, и они начнут сделать узоры из него, независимо от того, являются ли они реальными или нет.
Вы не можете сделать это с программой еще. Вы все еще должны точно сказать, что вы ищете на основе информации, которую вы ее даете. Помните, данные не является решением. Это инструмент. Бросая данных в командной команде машины без конкретной цели похожа на использование бананов к проволочным цепям. Вы обязательно получите что-то, но, вероятно, не станут тем, что вы ожидали.
Решите, какие параметры вам нужны
После того, как у вас есть определенная проблема, ваша команда может добраться до работы. Теперь им нужно выяснить, какие данные им нужны и как они могут получить его от того, что они имеются. Это будет такие вещи, как свойства автомобиля. Вы можете работать на автосалон, и они хотят знать, как максимизировать свою прибыль для определенной модели автомобиля. Таким образом, вы можете посмотреть на демографическую демографию людей, которые купили машину до, время суток, погода и, возможно, самые популярные цвета.
Это просто несколько быстрых примеров параметров, которые вы можете использовать для своих алгоритмов. Этот шаг имеет решающее значение при определении того, сколько данных и какие вам необходимые данные, и сколько времени потребуется для обучения вашей модели обучения машины. Чем больше параметров у вас есть, тем точнее будут ваши результаты. Хотя слишком много параметров могут сделать вашу модель супер медленной, что приводит к другим проблемам.
Выберите правильные данные тренировки
Вы знаете, какую проблему вы пытаетесь решить И вы знаете, какие параметры вам нужно начать работать над этим. Теперь вам нужно получить правильные данные тренировки. Это не сделает вам никаких пригодных для использования данных из Теннесси, если вы продаете автомобили на Аляске. Ваши данные должны согласовывать с проблемой, которую вы пытаетесь решить. Это время для компании для покупки данных или собирать данные от пользователей.
Ваша модель обучения машины будет так же хороша, как и данные, которые вы его даете. Большинство людей сосредоточены на алгоритмах из-за того, как их резак, и они забывают или игнорируют важность хороших, чистых данных. Это одна из тех вещей, которая имеет тенденцию упускать из виду, пока проект не будет в полном разгаре и может действительно укусить вас, если вы ждете слишком долго для исправлений.
Решить, какие алгоритмы использовать
Это где ваши умные машины изучают людей. Они должны иметь возможность принимать параметры, с которыми вы работаете, и выясните, какие алгоритмы использовать или как настроить их, чтобы соответствовать вашим потребностям. Они будут делать сравнения между временем обучения, коэффициентами ошибок и прогнозируемыми значениями. В зависимости от ресурсов и времени они имеют, они выберут, какой алгоритм сделает лучшую работу через небольшие тесты.
После более статистического анализа они начнут забиться математики, которая будет представлять ваш алгоритм. Затем они будут делать больше тестирования и анализа. Как только у них есть ошибка в допустимом диапазоне, и они говорили по деталям с остальной частью команды, разработчики захватывают. Также возможно, что ваши машинные обучающие люди будут писать код для алгоритмов.
Напишите код
Это когда все становится все более знакомым. Вы все еще проходите подобные процессы с вашей командой разработки. Там будут спринт и обзоры кода и развертывания. Эта группа соединяет всю теорию, которая привела к данному моменту. Они напишут код, который на самом деле поедет по тренировкам машины, и они будут подключать ее с данными, используемыми для обучения. На данный момент все действительно движутся, и труднее принимать фундаментальные изменения в проект.
Когда команда разработки закончится, вы должны иметь некоторое программное обеспечение, которое даст вам прогнозы или оптимизации на основе входных параметров, которые вы его даете. Это то, к чему весь этот процесс сводится к. Что вы решите сделать с информацией, программное обеспечение, выплевывая, зависит от этой проблемы, которую вы отправляете для решения.
Проверьте результаты
Ты сделал это! Проект сделан, и у вас есть интересные результаты, чтобы посмотреть. Во-первых, вы можете проверить, что ваши результаты имеют смысл. Используйте совершенно новые данные, чтобы увидеть, поддерживается ли ваша модель. Это может произойти медленно со временем, поскольку вы получаете больше пользовательских данных, или вы можете ускорить его, используя другой набор данных, чем то, с помощью которого вы обучены.
Убедитесь, что ваши результаты имеют смысл вам и остальной части команды, прежде чем делать какие-либо большие презентации. Держите свои тесты, относящиеся к начальной проблеме. Мы недостаточно продвинуты на машине, обучении программного обеспечения, чтобы критически думать о программном обеспечении, поэтому вам решать, чтобы сделать чек в здравомыслие.
За этим процессом гораздо больше орехов и болтов, и все они очень быстро интересны. Плюс, с библиотеками, такими как Tensorflow и Brainjs, проще для веб-разработчиков начать тестирование машиностроенных вод. Поле широко открыто для всех достаточно смелых (или достаточно сумасшедших), чтобы прыгать.
Как вы думаете, машинное обучение стоит всего шумиха? Я думаю, что это дает нам несколько новых решений старым проблемам и с большей временем все лучше. Но это имеет тенденцию привести к философским вопросам, как, может ли машина думать? И как далеко мы должны Действительно Иди с обучением машины?
Привет! Вы должны следовать за мной в Twitter, поскольку причины: https://twitter.com/flaphedcoding.
Оригинал: “https://dev.to/flippedcoding/steps-to-take-when-working-on-a-machine-learning-project-448d”