`
xjnine
  • 浏览: 48001 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类
最新评论
文章列表
Hbase有几种安装的方法,这里要讲的是在学习过程中用几台虚拟机模拟的分布式安装。   1.首先,下载Hbase对应的包,要注意需要下载和hadoop版本相对应的hbase版本,防止产生不兼容的问题,具    体版本对应可以再apache官网进行查询。(hbase-0.98.4-hadoop2与hadoop-2.3.0)   2.解压包后,将hbase-0.98.4-hadoop2放在/home/usr目录下面,在/hbase-0.98.4-hadoop2/lib文件下面查看对    应的‘hadoop*jar’所对应的hadoop版本,如果和自己所安装的hadoop版本一致,则不需 ...
思想:DenStream可以说是针对Clustream的缺陷进行改进的,通过引入CMC(核心微簇),PMC(潜在核心微簇)以及OMC(离群微簇)以及时间衰减函数f(t)=2-λ来对不同时间的数据点的重要性进行加权。对微簇micro-cluster的定义也加入了时间权重。   方法:在线阶段,同时维护PMC和OMC两个队列,根据在两个队列的权重变化来对微簇的在潜在核心和离群两个角色进行调整变化。在线下阶段,通过改进的DBSCAN算法对 PMC进行聚类,最终获得聚类结果。   步骤: on-line phase: Merging (p)1: Try to merge p into i ...
思想:clustream算法的核心思想就是金字塔时间快照,以及分为on-line操作的micro-cluster和off-line操作的macro-cluster两个阶段,同时属于landmark window(界标窗口)的处理模式。   方法:其中micro-cluster是用来存储数据点的特征向量组 ...
Ant       1)下载    http://ant.apache.org/bindownload.cgi    apache-ant-1.9.4-bin.zip  2)解压到一个盘,如图所示:      3
  由于hadoop2.x后,在lib/native/目录下面的libhadoop.so.1.0.0 文件是32位的,所以如果在64位的linux上安装官方提供的hadoop2.x,肯定不能运行,就需要对其进行编译。编译过程详见另一篇blog。     但是在编译过程中总是出现下面错误 : [ERROR] Failed to execute goal org.apache.maven.plugins:maven-antrun-plugin:1.7:run (create-testdirs) on project hadoop-project: Error executing ant ta ...
Ubuntu中 SSH连接错误: WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED 出现问题:在配置hadoop实验环境的时候,对各个节点进行SSH免密码登录配置的时候,用node21节点对master2节点进行SSH连接的时候,发生了WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED的错误, 问题原因:对master2节点ping,发现网络是正常的。通过查找发现,是在.ssh文件下known_hosts这个文件中的信息发生了变化。 解决方法:将know_hosts中的内容删除,保存,退出。
一.安装hadoop分布式集群: 1 安装Vmware WorkStation软件 有些人会问,为何要安装这个软件,这是一个VM公司提供的虚拟机工作平台,后面需要在这个平台上安装linux操作系统。具体安装过程网上有很多资料,这里不作过多的说明。 ...
1. 问题 之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。回想我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。我们可以使用PCA来降维,但PCA没有将类别标签考虑进去,属于无监督的。 比如回到上次提出的文档中含有“learn”和“study”的问题,使用PCA后,也许可以将这两个特征合并为一个,降了维度。但假设我们的类别标签y是判断这篇文章的topic是不是有关学习方面的。那么这两个特征对y几乎没什么影响,完全可以去除。 再举一个例子,假设我们对一张100*100像素的图片做人脸识别,每个像素是一个特征,那么会有10000个特征,而对 ...
AlphaGo使用蒙特卡洛树搜索(Monte Carlo tree search),借助值网络(value network)与策略网络(policy network)这两种深度神经网络,通过值网络来评估大量选点,并通过策略网络选择落点。   什么是 MCTS? 全称 Monte Carlo Tree Search,是一种人工智能问题中做出最优决策的方法,一般是在组合博弈中的行动(move)规划形式。它结合了随机模拟的一般性和树搜索的准确性。  
P2P到底是什么呢? P2P借贷是一种将非常小额度的资金聚集起来借贷给有资金需求人群的一种民间小额借贷模式。P2P是“Peer-to-Peer”的简写,个人对个人的意思,P2P借贷指个人通过第三方平台(P2P公司)在收取一定服务费用的前提下向其他个人提供小额借贷的金融模式。 P2P模式 第一种是纯线上模式,是纯粹的P2P,在这种平台模式上纯粹进行信息匹配,帮助资金借贷双方更好的进行资金匹配,但缺点明显,这种线上模式并不参与担保; 第二种是债权转让模式,平台本身先行放贷,再将债权放到平台进行转让,很明显能让企业提高融资端的工作效率,但容易出现资金池,不能让资金充分发挥效益;
   目前计算机网络常用的实验软件有:NS2,NS3,OPENET,GNS3和Packet tracer等。NS2,NS3和OPENET侧重于路由协议原理的模拟,适合于科学研究;后几种软件更适合路由交换的组网与配置模拟。GNS3直接加载路由器IOS来实现模拟,占内存比较多,CPU使用率高,适合高级用户。Packet tracer是思科提供的,是思科网络工程师认证的模拟教学软件,支持常用的协议模型,具有良好的图形界面,可以方便的再现网络环境,操作方便,交互性强,直观形象。       
(1)利用ISI Web of Knowledge 进行检索:首先检索某个专题文献,然后点击“分析检索结果”,在“根据字段排列记录:”下方的下拉菜单中点击“文献类型”,点击“分析”,勾选Review前面的复选框,点击“查看记录”即可获取所需要的高品质综述;(2)生物医学类综述文章可利用NCBI进行检索:进入NCBI网站,在“Search”下拉菜单中,点击进入“Pubmed”,再点击“Limits”,在“Type of Article”下拉菜单中找到“Review”并选中,然后在Search框中输入所需要的检索词或检索式即可获得相关综述性文章;(3)通过全文数据库获取综述性文章的方法:先进行专 ...
国外的博士论文很多工作系统性强,条理清晰,是科研者很好的参考资料。可是怎么样能够搜索并下载到fulltext,比如如何利用好Google工具来检索呢,大家来讨论下,各抒己见,互相学习,共同进步吧PS:发起话题已经有几天了,大家发言都很中肯,我把各位虫友的意见总结了下,得到了简单的搜索国外硕博士论文的方法,将会继续更新完善......1、利用专业的博士论文数据库
最近一直有师弟师妹和朋友问我数学和研究的关系,研一要去学什么数学课。毕竟在清华,衡量一个研究生最重要的指标之一就是paper,而没有数学,是肯定上不了世界顶级的期刊和会议的,这在计算机学界尤其重要!你会发现, ...
 在过去的一年中,我一直在数学的海洋中游荡,research进展不多,对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界?作为计算机的学生,我没有任何企图要成为一个数学家。我学习数学的目的,是要想爬上巨 ...
Global site tag (gtag.js) - Google Analytics