更多精彩内容尽在www.leonarding.com
《SAS9.3 邮件日志数据经典案例分析》
版本info
User:leonarding
Date:2013.10.10
OS Version:windows 7 64bit
SAS Version:9.3
引言:SAS作为一种ETL整理工具,善于把一些杂乱无章的数据梳理成标准可见的数据集,有了标准的数据集我们就可以进一步的进行详细数据分析,本文为大家详细讲述了邮件系统日志记录的ETL编程处理过程与注意事项。让我们亲身体验到SAS强大的数据整合能力和分析能力,下面让我们进入主题。
这篇文章中我们讲解了两个小专题,如下所示
第一 SAS9.3 变更输出窗口模式
如何配置SAS 窗口环境中的 LISTING 输出和HTML输出
前者在输出窗中输出,后者网页版输出
第二 题目要求:现在有一个maillog.txt文本文件,这是从邮件系统上截取下来的,要求用SAS对文件进行ETL处理提取以下内容
1 目标邮箱
2 发送是否成功(success/deferral/...)
3 如果失败则记录失败原因(对方服务器应答内容)某些邮箱会被反复发送多次,那么只提取最后一次记录
SAS编程思路
(1) 获取标识号id和目标邮箱地址
(2) 获取标识号id、发送状态、反馈信息、删除不符合要求的信息
(3) 合并上述两个数据集email、delivery_status按照email和id进行排序
(4) 合并上述两个数据集email、delivery_status按照email和id进行排序
具体SAS语句在下面的PDF中,大家可下载后复制->粘贴即可使用
maillog.rar 原始文本文件,这是SAS程序的数据源,请点击下载
SAS9.3 邮件日志数据经典案例分析.pdf 这是SAS程序,请点击下载SAS编程 if语句 index函数 substr(s,p,n)函数 merge合并
Leonarding
2013.10.20
北京&autumn
分享技术~成就梦想
Blog:www.leonarding.com