如何用Java开始机器学习

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用Java开始机器学习相关的知识,希望对你有一定的参考价值。

说到如何开始使用 Java 机器学习这个问题,相信对于从事Java开发的人来说是非常重要的,也是这段时间几乎每个人都在谈论人工智能和机器学习,这已经不再是一个保留给科学家和研究者的秘密,而是几乎实现于每一项新兴技术中。
人类的人工智能人工智能在一段时间以来是一个广泛并且炫酷的领域,但总是感觉有点难以触及,是特意为科学家所做。如果你想创造一个人工智能系统,你必须实现你自己的核心算法,并且训练它们能识别模式,理解图像并且处理自然语言。

那么,如何使用 Java 机器学习,提升应用的机器学习能力呢?
让机器运转为了更简单的阐述,以下几个项目可以帮助你:
1.Deeplearning4J (DL4J) –开源,分布式,JVM的商业深度学习lib库
2. BID Data Project –能够运行快速、大规模的机器学习和数据挖掘的模式集合
3. Neuroph –面向对象的神经网络
DL4J – 深度学习
DL4J是一个能帮助你配置多层神经网络的工具。它为JVM提供了深度学习且伴随快速原型设计和大规模定制,同时注重比配置更多的约定。DL4J 是由Java语言编写的,可以兼容任何JVM语言。
BID Data Project (大数据项目)
大数据项目是由那些需要处理大量数据并且对性能敏感的人创建的。 UC Berkeley项目是由许多硬件、软件和设计模式集合而成,能在上使用快速、大规模的数据挖掘。
Neuroph
neuroph是用来开发常用的神经网络构架的轻量级java框架。该框架提供了一个java库以及一个GUI工具(称为easyNeurons),你可以用它来在java项目中创建和训练自己的神经网络。
总结:每隔几年就会有些关于人工智能的新声音。这一次,它伴随着机器学习,数据挖掘,神经网络等等的强化来了,我们都很支持。这些类库开源的事实意味着这些信息和能力正待价而沽,而你所有所做的是思考拥有这个能力可以做成什么。
参考技术A 说到如何开始使用 Java 机器学习这个问题,相信对于从事Java开发的人来说是非常重要的,也是这段时间几乎每个人都在谈论人工智能和机器学习,这已经不再是一个保留给科学家和研究者的秘密,而是几乎实现于每一项新兴技术中。
人类的人工智能人工智能在一段时间以来是一个广泛并且炫酷的领域,但总是感觉有点难以触及,是特意为科学家所做。如果你想创造一个人工智能系统,你必须实现你自己的核心算法,并且训练它们能识别模式,理解图像并且处理自然语言。

那么,如何使用 Java 机器学习,提升应用的机器学习能力呢?
让机器运转为了更简单的阐述,以下几个项目可以帮助你:
1.Deeplearning4J (DL4J) –开源,分布式,JVM的商业深度学习lib库
2. BID Data Project –能够运行快速、大规模的机器学习和数据挖掘的模式集合
3. Neuroph –面向对象的神经网络
DL4J – 深度学习
DL4J是一个能帮助你配置多层神经网络的工具。它为JVM提供了深度学习且伴随快速原型设计和大规模定制,同时注重比配置更多的约定。DL4J 是由Java语言编写的,可以兼容任何JVM语言。
BID Data Project (大数据项目)
大数据项目是由那些需要处理大量数据并且对性能敏感的人创建的。 UC Berkeley项目是由许多硬件、软件和设计模式集合而成,能在上使用快速、大规模的数据挖掘。
Neuroph
neuroph是用来开发常用的神经网络构架的轻量级java框架。该框架提供了一个java库以及一个GUI工具(称为easyNeurons),你可以用它来在java项目中创建和训练自己的神经网络。
总结:每隔几年就会有些关于人工智能的新声音。这一次,它伴随着机器学习,数据挖掘,神经网络等等的强化来了,我们都很支持。这些类库开源的事实意味着这些信息和能力正待价而沽,而你所有所做的是思考拥有这个能力可以做成什么。

如何用 Python 构建机器学习模型?

????????关注后回复 “进群” ,拉你进程序员交流群????????

作者丨Anello

译者丨Sambodhi

策划丨凌敏

来源丨AI前线(ID:ai-front)

本文,我们将通过 Python 语言包,来构建一些机器学习模型。

构建机器学习模型的模板

该 Notebook 包含了用于创建主要机器学习算法所需的代码模板。在 scikit-learn 中,我们已经准备好了几个算法。只需调整参数,给它们输入数据,进行训练,生成模型,最后进行预测。

1. 线性回归

对于线性回归,我们需要从 sklearn 库中导入 linear_model。我们准备好训练和测试数据,然后将预测模型实例化为一个名为线性回归 LinearRegression 算法的对象,它是 linear_model 包的一个类,从而创建预测模型。之后我们利用拟合函数对算法进行训练,并利用得分来评估模型。最后,我们将系数打印出来,用模型进行新的预测。

# Import modules
from sklearn import linear_model

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted_variable

x_test  = test_dataset_precictor_variables

# Create linear regression object
linear = linear_model.LinearRegression()

# Train the model with training data and check the score
linear.fit(x_train, y_train)
linear.score(x_train, y_train)

# Collect coefficients
print('Coefficient: \\n', linear.coef_)
print('Intercept: \\n', linear.intercept_)

# Make predictions
predicted_values = linear.predict(x_test)

2. 逻辑回归

在本例中,从线性回归到逻辑回归唯一改变的是我们要使用的算法。我们将 LinearRegression 改为 LogisticRegression。

# Import modules
from sklearn.linear_model import LogisticRegression

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted_variable

x_test  = test_dataset_precictor_variables

# Create logistic regression object
model = LogisticRegression()

# Train the model with training data and checking the score
model.fit(x_train, y_train)
model.score(x_train, y_train)

# Collect coefficients
print('Coefficient: \\n', model.coef_)
print('Intercept: \\n', model.intercept_)

# Make predictions
predicted_vaues = model.predict(x_teste)

3. 决策树

我们再次将算法更改为 DecisionTreeRegressor:

# Import modules
from sklearn import tree

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted_variable

x_test  = test_dataset_precictor_variables

# Create Decision Tree Regressor Object
model = tree.DecisionTreeRegressor()

# Create Decision Tree Classifier Object
model = tree.DecisionTreeClassifier()

# Train the model with training data and checking the score
model.fit(x_train, y_train)
model.score(x_train, y_train)

# Make predictions
predicted_values = model.predict(x_test)

4. 朴素贝叶斯

我们再次将算法更改为 DecisionTreeRegressor:

# Import modules
from sklearn.naive_bayes import GaussianNB

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted variable

x_test  = test_dataset_precictor_variables

# Create GaussianNB object
model = GaussianNB()

# Train the model with training data 
model.fit(x_train, y_train)

# Make predictions
predicted_values = model.predict(x_test)

5. 支持向量机

在本例中,我们使用 SVM 库的 SVC 类。如果是 SVR,它就是一个回归函数:

# Import modules
from sklearn import svm

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted variable

x_test  = test_dataset_precictor_variables

# Create SVM Classifier object  
model = svm.svc()

# Train the model with training data and checking the score
model.fit(x_train, y_train)
model.score(x_train, y_train)

# Make predictions
predicted_values = model.predict(x_test)

6.K- 最近邻

在 KneighborsClassifier 算法中,我们有一个超参数叫做 n_neighbors,就是我们对这个算法进行调整。

# Import modules
from sklearn.neighbors import KNeighborsClassifier

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted variable

x_test  = test_dataset_precictor_variables

# Create KNeighbors Classifier Objects  
KNeighborsClassifier(n_neighbors = 6) # default value = 5

# Train the model with training data
model.fit(x_train, y_train)

# Make predictions
predicted_values = model.predict(x_test)

7.K- 均值

# Import modules
from sklearn.cluster import KMeans

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted variable

x_test  = test_dataset_precictor_variables

# Create KMeans objects 
k_means = KMeans(n_clusters = 3, random_state = 0)

# Train the model with training data
model.fit(x_train)

# Make predictions
predicted_values = model.predict(x_test)

8. 随机森林

# Import modules
from sklearn.ensemble import RandomForestClassifier

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted variable

x_test  = test_dataset_precictor_variables

# Create Random Forest Classifier objects 
model = RandomForestClassifier()

# Train the model with training data 
model.fit(x_train, x_test)

# Make predictions
predicted_values = model.predict(x_test)

9. 降维

# Import modules
from sklearn import decomposition

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted variable

x_test  = test_dataset_precictor_variables

# Creating PCA decomposition object
pca = decomposition.PCA(n_components = k)

# Creating Factor analysis decomposition object
fa = decomposition.FactorAnalysis()

# Reduc the size of the training set using PCA
reduced_train = pca.fit_transform(train)

# Reduce the size of the training set using PCA
reduced_test = pca.transform(test)

10. 梯度提升和 AdaBoost

# Import modules
from sklearn.ensemble import GradientBoostingClassifier

# Create training and test subsets
x_train = train_dataset_predictor_variables
y_train = train_dataset_predicted variable

x_test  = test_dataset_precictor_variables

# Creating Gradient Boosting Classifier object
model = GradientBoostingClassifier(n_estimators = 100, learning_rate = 1.0, max_depth = 1, random_state = 0)

# Training the model with training data 
model.fit(x_train, x_test)

# Make predictions
predicted_values = model.predict(x_test)

我们的工作将是把这些算法中的每一个块转化为一个项目。首先,定义一个业务问题,对数据进行预处理,训练算法,调整超参数,获得可验证的结果,在这个过程中不断迭代,直到我们达到满意的精度,做出理想的预测。

原文链接:

https://levelup.gitconnected.com/10-templates-for-building-machine-learning-models-with-notebook-282c4eb0987f

-End-

最近有一些小伙伴,让我帮忙找一些 面试题 资料,于是我翻遍了收藏的 5T 资料后,汇总整理出来,可以说是程序员面试必备!所有资料都整理到网盘了,欢迎下载!

点击????卡片,关注后回复【面试题】即可获取

在看点这里好文分享给更多人↓↓

以上是关于如何用Java开始机器学习的主要内容,如果未能解决你的问题,请参考以下文章

如何用70行Java代码实现深度神经网络算法

如何用Python实现常见机器学习算法-1

如何用 Python 构建机器学习模型?

如何用机器学习强化市场营销活动。

如何用Python实现常见机器学习算法-2

如何用Python实现常见机器学习算法-3