python设置定时任务(定时执行脚本) |
您所在的位置:网站首页 › python自动执行脚本 › python设置定时任务(定时执行脚本) |
python设置定时任务(定时执行脚本)
艾孜尔江: while true???????????????????? Spark读写S3(AWS亚马逊中国区beijing)yan12344: 请问老师,如何“引入Hadoop-2.7.2的lib中的hadoop-aws-2.7.2.jar,以及aws自己提供的sdk包:aws-Java-sdk-1.7.4.jar”呢?我是小白,用的是单机版本的spark,python接口。期望您的解答 mahout之推荐系统源码笔记(2) ---相似度计算之RowSimilarityJobqq_27380363: 楼主,我觉得下面有点疑问,我可以解释一下,如果有误请指出. 每行最相似度最大的topN个Item,最后生成的矩阵并非是对称矩阵,是一个非对称矩阵来的. 而mahout第一步求出了对称矩阵的上半段,下半段是没有求出, 因此算法分为两部走: (1)一部分为了性能,对上半段的每一行求topN,可以节省数据量. (2)下面的reduce是重新整合变成对称矩阵的下半段,再求出每一行的topN. 根据这两部分运算,计算速度是大幅度提高. protected void reduce(IntWritable row, Iterable partials, Context ctx) throws IOException, InterruptedException { Vector allSimilarities = Vectors.merge(partials); //重新求一遍TopN(因为转置以后得到的相似度还没有求过topN) //其实笔者认为数据量不大或者数据关联性不高的时候可以先求转置然后一次性直接求topN的 //这里mahout它是map的时候对对称矩阵的上半段求TopN然后在reduce中对所有再求一遍TopN Vector topKSimilarities = Vectors.topKElements(maxSimilaritiesPerRow, allSimilarities); ctx.write(row, new VectorWritable(topKSimilarities)); } mahout之推荐系统源码笔记(2) ---相似度计算之RowSimilarityJob「已注销」: 楼主,这个代码能给我发一份吗? [email protected] |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |