更多精彩内容尽在www.leonarding.com
《SAS 9.3 专题技术精粹【图文并茂版】》
版本info
User:leonarding
Date:2013.10.10
OS Version:windows 7 64bit
SAS Version:9.3
引言:SAS可以作为一种ETL工具整理数据,例如 日志文件 -> SAS -> Oracle,它可以把杂乱无章的字符串整理成行列模式的二维表,有了标准的数据集我们就可以进一步的进行详细数据分析,还可以把这种二维表单导入到关系型数据库中保存,下面我们就用几个实例来演示SAS整理数据功能。
我们设计了三个专题,如下所示
一 日志文件ip_pv_log,这是某网站每天的点击记录日志,包括计算时间,ip数,pv数。要求将此文本数据用SAS程序读入到数据集,数据集属性包括:日期(不用记录时间),ip数,pv数。
二 解出Excel电子表格demo.xls,这是记录发垃圾广告的id的数据表单,包括用户id,发帖次数和ip。请用图形界面和SAS编程两种方法将此表单导为数据集。
三下载dataguru论坛的访问日志片段(文本文件TXT),每行记录的含义如下(【】内的部分为注释,并非日志本身的内容): 121.33.190.166【ip地址】 - -[31/Mar/2012:00:00:07 +0800]【点击时间】 "GET /static/js/jquery-1.6.js【访问链接】 HTTP/1.1" 404 299【返回页面大小字节数】"http://f.dataguru.cn/thread-1427-2-1.html"【参照页链接】"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.54.16 (KHTML, likeGecko) Version/5.1.4 Safari/534.54.16"【使用的浏览器】 使用SAS软件把该日志文件读取为数据集,要求数据集记录ip、点击时间、点击链接、页面大小、浏览器等信息,然后把数据集中的ip、时间和点击链接信息回写到硬盘的一个文本文件中,要求提交程序和运行抓图。
我们使用图文并茂的手段来给大家讲解SAS 9.3的使用方法,请下载PDF
SAS 9.3 专题技术精粹.pdf 请点击下载
SAS编程 导入数据 导入文件 导出数据 解析文本
Leonarding
2013.10.10
北京&autumn
分享技术~成就梦想
Blog:www.leonarding.com