Hdfs的访问方式有两种,第一:类似Linux命令,Hadoopshell。第二:JavaAPI方式。先看第一种。
方法/步骤
1、FSShell调用文件系统(FS)Shell禅旄褡瘦命令应使用bin/hadoopfs<args>的形式。所有的的FSshell命令使用URI侨嚅检货路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和authority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme。一个HDFS文件或目录比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更简单的/parent/child(假设你配置文件中的默认值是namenode:namenodeport)。大多数FSShell命令的行为和对应的UnixShell命令类似,不同之处会在下面介绍各命令使用详情时指出。出错信息会输出到stderr,其他信息输出到stdout。hdfs://inc-dw-hadoop-151-7:9000/user/hadoop/wmg/copyfromlocal.txtcat使用方法:hadoopfs-catURI[URI…]将路径指定文件的内容输出到stdout。示例:hadoopfs-cathdfs://host1:port1/file1hdfs://host2:port2/file2hadoopfs-catfile:///file3/user/hadoop/file4返回值:成功返回0,失败返回-1。chgrp使用方法:hadoopfs-chgrp[-R]GROUPURI[URI…]Changegroupassociationoffiles.With-R,makethechangerecursivelythroughthedirectorystructure.Theusermustbetheowneroffiles,orelseasuper-user.AdditionalinformationisinthePermissionsUserGuide.-->改变文件所属的组。使用-R将使改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。更多的信息请参见HDFS权限用户指南。chmod使用方法:hadoopfs-chmod[-R]<MODE[,MODE]...|OCTALMODE>URI[URI…]改变文件的权限。使用-R将使改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。更多的信息请参见HDFS权限用户指南。chown使用方法:hadoopfs-chown[-R][OWNER][:[GROUP]]URI[URI]改变文件的拥有者。使用-R将使改变在目录结构下递归进行。命令的使用者必须是超级用户。更多的信息请参见HDFS权限用户指南。copyFromLocalput使用方法:hadoopfs-copyFromLocal<localsrc>URI除了限定源路径是一个本地文件外,和put命令相似。hadoopfs-copyFromLocalwmg/copyfromlocal.txt/user/hadoop/wmg前面是本地路径参数,后面是hdfs路径copyToLocal使用方法:hadoopfs-copyToLocal[-ignorecrc][-crc]URI<localdst>除了限定目标路径是一个本地文件外,和get命令类似。get使用方法:hadoopfs-get[-ignorecrc][-crc]<src><localdst>复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。示例:hadoopfs-get/user/hadoop/filelocalfilehadoopfs-gethdfs://host:port/user/hadoop/filelocalfile返回值:成功返回0,失败返回-1。put使用方法:hadoopfs-put<localsrc>...<dst>从本地文件系统中复制单个或多个源路径到目标文件系统。也支持从标准输入中读取输入写入目标文件系统。hadoopfs-putlocalfile/user/hadoop/hadoopfilehadoopfs-putlocalfile1localfile2/user/hadoop/hadoopdirhadoopfs-putlocalfilehdfs://host:port/hadoop/hadoopfilehadoopfs-put-hdfs://host:port/hadoop/hadoopfile从标准输入中读取输入。返回值:成功返回0,失败返回-1。getmerge使用方法:hadoopfs-getmerge<src><localdst>[addnl]接受一个源目录和一个目标文件作为输入,并且将源目录中所有的文件连接成本地目标文件。addnl是可选的,用于指定在每个文件结尾添加一个换行符。hadoopfs-getmerge/user/hadoop/wmg/wmg/merge.txtaddnl前提是merge的本地文件不存在。cp使用方法:hadoopfs-cpURI[URI…]<dest>将文件从源路径复制到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。示例:hadoopfs-cp/user/hadoop/file1/user/hadoop/file2hadoopfs-cp/user/hadoop/file1/user/hadoop/file2/user/hadoop/dir返回值:成功返回0,失败返回-1。du使用方法:hadoopfs-duURI[URI…]显示目录中所有文件的大小,或者当只指定一个文件时,显示此文件的大小。示例:hadoopfs-du/user/hadoop/dir1/user/hadoop/file1hdfs://host:port/user/hadoop/dir1返回值:成功返回0,失败返回-1。dus使用方法:hadoopfs-dus<args>显示文件的大小。显示文件的总的大小,指定文件夹就是文件夹下的总的大小。expunge使用方法:hadoopfs-expunge清空回收站。请参考HDFS设计文档以获取更多关于回收站特性的信息。ls使用方法:hadoopfs-ls<args>如果是文件,则按照如下格式返回文件信息:文件名<副本数>文件大小修改日期修改时间权限用户ID组ID如果是目录,则返回它直接子文件的一个列表,就像在Unix中一样。目录返回列表的信息如下:目录名<dir>修改日期修改时间权限用户ID组ID示例:hadoopfs-ls/user/hadoop/file1/user/hadoop/file2hdfs://host:port/user/hadoop/dir1/nonexistentfile返回值:成功返回0,失败返回-1。lsr使用方法:hadoopfs-lsr<args>ls命令的递归版本。类似于Unix中的ls-R。mkdir使用方法:hadoopfs-mkdir<paths>接受路径指定的uri作为参数,创建这些目录。其行为类似于Unix的mkdir-p,它会创建路径中的各级父目录。示例:hadoopfs-mkdir/user/hadoop/dir1/user/hadoop/dir2hadoopfs-mkdirhdfs://host1:port1/user/hadoop/dirhdfs://host2:port2/user/hadoop/dir返回值:成功返回0,失败返回-1。movefromLocal使用方法:dfs-moveFromLocal<src><dst>输出一个”notimplemented“信息。mv使用方法:hadoopfs-mvURI[URI…]<dest>将文件从源路径移动到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。示例:hadoopfs-mv/user/hadoop/file1/user/hadoop/file2hadoopfs-mvhdfs://host:port/file1hdfs://host:port/file2hdfs://host:port/file3hdfs://host:port/dir1返回值:成功返回0,失败返回-1。rm使用方法:hadoopfs-rmURI[URI…]删除指定的文件。只删除非空目录和文件。请参考rmr命令了解递归删除。示例:hadoopfs-rmhdfs://host:port/file/user/hadoop/emptydir返回值:成功返回0,失败返回-1。rmr使用方法:hadoopfs-rmrURI[URI…]delete的递归版本。示例:hadoopfs-rmr/user/hadoop/dirhadoopfs-rmrhdfs://host:port/user/hadoop/dir返回值:成功返回0,失败返回-1。setrep使用方法:hadoopfs-setrep[-R]<path>改变一个文件的副本系数。-R选项用于递归改变目录下所有文件的副本系数。示例:hadoopfs-setrep-w3-R/user/hadoop/dir1返回值:成功返回0,失败返回-1。stat使用方法:hadoopfs-statURI[URI…]返回指定路径的统计信息。示例:hadoopfs-statpath返回值:成功返回0,失败返回-1。tail使用方法:hadoopfs-tail[-f]URI将文件尾部1K字节的内容输出到stdout。支持-f选项,行为和Unix中一致。示例:hadoopfs-tailpathname返回值:成功返回0,失败返回-1。test使用方法:hadoopfs-test-[ezd]URI选项:-e检查文件是否存在。如果存在则返回0。-z检查文件是否是0字节。如果是则返回0。-d如果路径是个目录,则返回1,否则返回0。示例:hadoopfs-test-efilenametext使用方法:hadoopfs-text<src>将源文件输出为文本格式。允许的格式是zip和TextRecordInputStream。touchz使用方法:hadoopfs-touchzURI[URI…]创建一个0字节的空文件。示例:hadoop-touchzpathname返回值:成功返回0,失败返回-1。