scikit-learn: Сохранение и восстановление моделей

Во многих случаях при работе с библиотекой scikit-learn вам необходимо сохранить свои модели прогнозов в файл, а затем восстановить их, чтобы повторно использовать вашу предыдущую работу для: тестирования вашей модели на новых данных, сравнения нескольких моделей или что-нибудь еще. Эта процедура сохранения также известна как сериализация объекта - представляет объект с потоком байтов, чтобы сохранить его на диске, отправить по сети или сохранить в базе данных, в то время как процедура восстановления известна как десериализация. [Далее]

Деревья принятия решений в Python с помощью Scikit-Learn

Вступление Дерево решений - один из наиболее часто и широко используемых алгоритмов контролируемого машинного обучения, который может выполнять задачи как регрессии, так и классификации. Интуиция, лежащая в основе алгоритма дерева решений, проста, но при этом очень эффективна. Для каждого атрибута в наборе данных алгоритм дерева решений формирует узел, в котором наиболее важный атрибут помещается в корневой узел. Для оценки мы начинаем с корневого узла и продвигаемся вниз по дереву, следуя за соответствующим узлом, который соответствует нашему условию или «решению». [Далее]

Использование машинного обучения для прогнозирования погоды: часть 2

Эта статья является продолжением предыдущей статьи из серии из трех частей, посвященных использованию машинного обучения в Python для прогнозирования погодных температур в городе Линкольн, штат Небраска, США, на основе данных, собранных из служб API Weather Underground. В первой статье серии « Использование машинного обучения для прогнозирования погоды: часть 1» я описал, как извлечь данные из Weather Underground, проанализировать их и очистить. Краткое изложение тем для каждой из статей, представленных в этой серии, можно найти во введении к предыдущей статье. [Далее]

Лучшие библиотеки машинного обучения на Python

Вступление Нет сомнений в том, что нейронные сети и машинное обучение в целом были одной из самых горячих тем в сфере технологий в последние несколько лет или около того. Легко понять, почему они решают все действительно интересные варианты использования, такие как распознавание голоса, распознавание изображений или даже музыкальная композиция . Итак, для этой статьи я решил составить список некоторых из лучших библиотек машинного обучения Python и разместил их ниже. На мой взгляд, Python - один из лучших языков, которые вы можете использовать для изучения (и реализации) методов машинного обучения по нескольким причинам: [Далее]

Наивный байесовский алгоритм в Python с помощью Scikit-Learn

При изучении теории вероятностей и статистики одной из первых и наиболее важных теорем, которые изучают студенты, является теорема Байеса . Эта теорема является основой дедуктивного мышления, которое фокусируется на определении вероятности возникновения события на основе предварительных знаний об условиях, которые могут быть связаны с этим событием. Наивный байесовский классификатор привносит силу этой теоремы в машинное обучение, создавая очень простой, но мощный классификатор. В этой статье мы увидим обзор того, как работает этот классификатор, какие у него подходящие приложения и как использовать его всего в нескольких строках Python и библиотеки Scikit-Learn. [Далее]

Обзор курса: Машинное обучение AZ - Практический Python и R в области науки о данных

Предисловие Каждый день мы сталкиваемся с постоянными инновациями во многих областях, и огромный рост в области вычислений предлагает нам различные технологии. Мы генерируем более 2 эксабайт данных каждый день, что слишком сложно для обработки одними лишь человеческими усилиями. Инженеры всего мира разработали средства автоматизации для выполнения таких упражнений. Следующим шагом в этом процессе является машинное обучение, которое позволяет компьютерным алгоритмам принимать обоснованные решения в определенных сценариях. В связи с появлением таких технологий, как искусственный интеллект, беспилотные автомобили и распознавание речи, все мы сознательно или иным образом использовали машинное обучение как технологию. [Далее]

Обзор курса: учебный курс Python для науки о данных и машинного обучения

Прежде чем мы начнем, было бы полезно узнать, что такое наука о данных и машинное обучение. Итак, если вы не знаете, вот несколько основных определений: Наука о данных - это междисциплинарная область научных методов, процессов, алгоритмов и систем для извлечения знаний или идей из данных в различных формах, как структурированных, так и неструктурированных. Машинное обучение - это область информатики, которая часто использует статистические методы, чтобы дать компьютерам возможность «учиться» с данными без явного программирования. [Далее]

Реализация LDA в Python с помощью Scikit-Learn

В нашей предыдущей статье « Реализация PCA в Python с помощью Scikit-Learn» мы изучили, как можно уменьшить размерность набора функций с помощью PCA. В этой статье мы изучим еще один очень важный метод уменьшения размерности:линейный дискриминантный анализ (или LDA). Но сначала давайте кратко обсудим, чем PCA и LDA отличаются друг от друга. PCA против LDA: в чем разница? И PCA, и LDA представляют собой методы линейного преобразования. Однако PCA является неконтролируемым, а LDA - контролируемым методом уменьшения размерности. [Далее]

Реализация PCA на Python с помощью Scikit-Learn

Благодаря наличию высокопроизводительных процессоров и графических процессоров, практически возможно решить все проблемы регрессии, классификации, кластеризации и другие связанные проблемы с использованием моделей машинного обучения и глубокого обучения. Тем не менее, существуют различные факторы, которые вызывают узкие места в производительности при разработке таких моделей. Большое количество функций в наборе данных является одним из факторов, влияющих как на время обучения, так и на точность моделей машинного обучения. У вас есть разные варианты работы с огромным количеством функций в наборе данных. [Далее]

Реализация Word2Vec с библиотекой Gensim на Python

Вступление У людей есть естественная способность понимать, что говорят другие люди и что им отвечать. Эта способность развивается благодаря постоянному взаимодействию с другими людьми и обществом на протяжении многих лет. Язык играет очень важную роль в том, как люди взаимодействуют. Языки, которые люди используют для взаимодействия, называются естественными языками. Правила разных естественных языков различны. Однако естественные языки объединяет одно: гибкость и эволюция. Естественные языки очень гибкие. Предположим, вы ведете машину, и ваш друг произносит одно из этих трех высказываний: «Остановить», «Остановить машину», «Остановиться». [Далее]