其他

书单

1、货币战争 2、小岛经济学 本文固定链接:天才在左的博客 » 书单本站内容除特别标注外均为原创,欢迎转载,但请保留出处! ...

540224846@qq.com 2019-02-11 17:09 24℃ 0评论

数据挖掘

【转】SMOTE sampling方法

转自:http://sofasofa.io/forum_main_post.php?postid=1000817& 介绍 SMOTE是一种对普通过采样(oversampling)的一个改良。普通的过采样会使得训练集中有很多重复的样本。 SMOTE的全称是Synthetic Minority  ...

540224846@qq.com 2019-01-03 16:50 96℃ 0评论

bigdata

【转】Flink 内存管理机制

转自:http://www.whitewood.me/2018/07/07/Flink-%E5%86%85%E5%AD%98%E7%AE%A1%E7%90%86%E6%9C%BA%E5%88%B6/ Flink 作为一个基于内存的分布式计算引擎,其内存管理模块很大程度上决定了系统的效率和稳定性,尤其 ...

540224846@qq.com 2018-12-27 10:47 78℃ 0评论

bigdata

【转】实时计算storm spark flink 比较和理解

https://102.alibaba.com/detail?id=170 Flink 靠什么征服饿了么工程师? 阿里妹导读:本文将为大家展示饿了么大数据平台在实时计算方面所做的工作,以及计算引擎的演变之路,你可以借此了解Storm、Spark、Flink的优缺点。如何选择一个合适的实时计算引擎?F ...

540224846@qq.com 2018-12-26 11:18 276℃ 0评论

python

集成学习stacking

理论 https://www.cnblogs.com/gczr/p/7144508.html 1)TrainingData进行5-fold分割,正好生成5个model,每个model预测训练数据的1/5部分,最后合起来正好是一个完整的训练集Predictions,行数与TrainingData一致。 ...

540224846@qq.com 2018-12-26 10:40 100℃ 0评论

python

【转】机器学习gridsearchcv(网格搜索)和kfold validation(k折验证)

转自:https://www.deeplearn.me/1699.html 网格搜索算法和K 折交叉验证法是机器学习入门的时候遇到的重要的概念。 网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法。 以决策树为例,当我们确定了要使用决策树算法的时候,为了能够更好地拟合和预测,我们需要调整它 ...

540224846@qq.com 2018-12-24 15:23 90℃ 0评论

linux

linux中各用户的yum配置

添加~/.pip/pip.conf文件 配置如下: [global] timeout=60 index-url=yum url trusted-host= host 本文固定链接:天才在左的博客 » linux中各用户的yum配置本站内容除特别标注外均为原创,欢迎转载,但请保留出处! ...

540224846@qq.com 2018-11-06 13:58 136℃ 0评论

linux

crontab 中的日志输出

1、linux中crontab定时任务执行过程中一般都是相对路径,如用户主目录,所以如日志输出,文件输出都输出在此目录。 2、对于普通脚本不在crontab中能运行,而放到crontab中则运行失败,这一般是因为环境变量引起的,而它的日志是输出在tail -300f /var/spool/mail/ ...

540224846@qq.com 2018-11-06 13:51 160℃ 0评论

linux

linux 系统下单用户安装python包

为了规避权限问题,需要单用户安装python包,命令如下: pip3 install --user setup.py/*.whl python3 setup.py install --user 本文固定链接:天才在左的博客 » linux 系统下单用户安装python包本站内容除特别 ...

540224846@qq.com 2018-10-31 10:37 175℃ 0评论