数据采集工具的安装和使用-创新互联

数据采集是大数据分析全流程的重要环节,典型的数据采集工具包括ETL工具、日志采集工具、数据迁移工具等。

成都创新互联公司主要从事成都做网站、网站建设、网页设计、企业做网站、公司建网站等业务。立足成都服务康巴什,十载网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:18980820575

Flume是一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统。

1.安装Flume

下载:http://www.apache.org/dist/flume/

hadoop@dblab:/usr/local$ sudo wget http://www.apache.org/dist/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz

hadoop@dblab:/usr/local$ sudo tar -zxvf apache-flume-1.7.0-bin.tar.gz 

hadoop@dblab:/usr/local$ sudo mv apache-flume-1.7.0-bin ./flume

2.配置环境变量

hadoop@dblab:/usr/local$ sudo vim ~/.bashrc

export FLUME_HOME=/usr/local/flume

export FLUME_CONF_DIR=$FLUME_HOME/conf

export JAVA_HOME=/usr/lib/jvm/default-java

export PATH=$PATH:$HIVE_HOME/bin

hadoop@dblab:/usr/local$ source ~/.bashrc

hadoop@dblab:/usr/local/flume/conf$ mv flume-env.sh.template  flume-env.sh

hadoop@dblab:/usr/local/flume/conf$ sudo vim   flume-env.sh  

#在flume-env.sh文件开头加入如下语句:                    

export JAVA_HOME=/usr/lib/jvm/default-java

3.启动Flume

hadoop@dblab:/usr/local/flume$ cd /usr/local/flume

hadoop@dblab:/usr/local/flume$ ./bin/flume-ng version

错误: 找不到或无法加载主类 org.apache.flume.tools.GetJavaProperty

Flume 1.7.0

Source code repository: https://git-wip-us.apache.org/repos/asf/flume.git

Revision: 511d868555dd4d16e6ce4fedc72c2d1454546707

Compiled by bessbd on Wed Oct 12 20:51:10 CEST 2016

From source with checksum 0d21b3ffdc55a07e1d08875872c00523

hadoop@dblab:/usr/local/flume$ cd /usr/local/hbase/conf

hadoop@dblab:/usr/local/hbase/conf$ sudo vim hbase-env.sh   

#export HBASE_CLASSPATH=/usr/local/hadoop/conf #注释该行,即解决上述问题

hadoop@dblab:/usr/local/flume$ ./bin/flume-ng version

Flume 1.7.0

Source code repository: https://git-wip-us.apache.org/repos/asf/flume.git

Revision: 511d868555dd4d16e6ce4fedc72c2d1454546707

Compiled by bessbd on Wed Oct 12 20:51:10 CEST 2016

From source with checksum 0d21b3ffdc55a07e1d08875872c00523

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


当前文章:数据采集工具的安装和使用-创新互联
文章地址:http://cdiso.cn/article/codepc.html

其他资讯