数据处理的统计学习(scikit-learn教程)
独立成分分析:ICA # Generate sample datatime = np.linspace(0,10,2000) s1 = np.sin(2 * time) ?# Signal 1 : sinusoidal signals2 = np.sign(np.sin(3 * time)) ?# Signal 2 : square signalS = np.c_[s1,s2] S += 0.2 * np.random.normal(size=S.shape) ?# Add noiseS /= S.std(axis=0) ?# Standardize data# Mix dataA = np.array([[1,[0.5,2]]) ?# Mixing matrixX = np.dot(S,A.T) ?# Generate observations# Compute ICAica = decomposition.FastICA() S_ = ica.fit_transform(X) ?# Get the estimated sourcesA_ = ica.mixing_.T np.allclose(X,?np.dot(S_,A_) + ica.mean_) 五、联合起来(1)管道(流水线)我们已经知道了一些估测器(模型)能够转换数据,一些可以预测变量。我们也能够将其结合到一起: from sklearn import linear_model,decomposition,datasetsfrom sklearn.pipeline import Pipelinefrom sklearn.grid_search import GridSearchCV logistic = linear_model.LogisticRegression() pca = decomposition.PCA() pipe = Pipeline(steps=[('pca',pca),('logistic',logistic)]) digits = datasets.load_digits() X_digits = digits.data y_digits = digits.target################################################################################ Plot the PCA spectrumpca.fit(X_digits) plt.figure(1,figsize=(4,3)) plt.clf() plt.axes([.2,.2,.7,.7]) plt.plot(pca.explained_variance_,linewidth=2) plt.axis('tight') plt.xlabel('n_components') plt.ylabel('explained_variance_')################################################################################ Predictionn_components = [20,40,64] Cs = np.logspace(-4,4,3) (2)使用特征联进行人脸识别? ?该实例使用的数据集是从“Labeled Faces in the Wild”节选预处理得到的。更为熟知的名字是LFW。 http://vis-www.cs.umass.edu/lfw/lfw-funneled.tgz(233 MB) 六、寻求帮助###(1)项目邮件列表 (2)问答(Q&A)机器学习从业者参与的社区
数据挖掘入门与实战 搜索添加微信公众号:datadw 教你机器学习,教你数据挖掘 长按图片,识别二维码,点关注 ? 公众号: weic2c? ? 长按图片,识别二维码,点关注 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |