Enterprise Miner(SAS)
SAS Enterprise Miner在资料探勘工具市场是非常杰出的工具,它运用了SAS统计模块的力量和影响力,且它增加了一系列的资料探勘算法,SAS使用它的取样、探测、修改、模式、评价(SEMMA)方法提供可以支持广泛的模式,包含合并、丛集、决策树、类神精网络、和统计回归 SASEnterpriseMiner适用于初学者及专业使用者,它的GUI接口是以资料流为导向,且它容易了解及使用,它允计分析师藉由使用连结连接资料节点及程序节点的方式建构一视觉数据流程图,除此之外,接口还允许程序码直接嵌入资料流因为支持多重模式。
Enterprise Miner允许使用者比较models和利用评估节点所选择之最适模式,除此之外,Enterprise Miner提供产生评定模式之评定节点能够存取任何SAS应用软件结论SAS利用它在统计分析软件上的专业来发展全功能、易于使用、可靠且可管理的系统,有大范围的模式选项和算法、设计良好的使用者接口、利用已存在的资料储存能力,和在统计分析上相当大的市场占有率(允许公司取得SAS新增的组件比增加一套新的工作来得好多了),对SAS来说,它在资料探勘市场上终究还是领导者整体而言,这个工具适用于企业在资料探勘的发展及整个CRM的决策支持应用.
Clementine(SPSS)
Clementine是SPSS所发行的一种资料探勘工具,此工具结合了多种图形使用者接口的分析技术,包含neural networks、association rules、及rule-induction techniques,这些工具提供容易使用的可视化程序环境来执行这些分析功能。Clementine使用图形象征的方法,就是透过托拉鼠标和连接屏幕上的功能节点,这些节点提供了data access、data manipulation、data visualization、machine learning以及model analysis,模式的组成是从一个pallet中选取合适之节点,并放置在屏幕上再连接各节点Clementine有强大的资料存取能力包含flat file及关系型数据库(经由ODBC),Clementine也可让modeling的结果持续的写回一ODBC的DBMS输入资料的操作包含配对合并及衍生新字段的能力,Clementine的资料可视化能力包含散布图、平面图及Web分析.
4Thought and Scenario(Cognos)
Cognos介绍两个资料探勘工具的组合:4Thought和Scenario来巩固它在OLAP市场的位置,这些工具藉由利用neural networks和CHAID技术提供资料探勘能力,一般而言,Cognos所有平台和特殊用途的窗口环境都支持这些工具,这两个工具都需要电子表格、数据库和ASCII文字文件作为资料来源 4Thought可以处理在寻求价格最佳化、需求预测及效能预测及衡量等各种商业问题,4Thought使用multilayer perceptron OLAP、neural network技术,适用于分析问题,处理non-linear forms、noisy datal及small data sets,4Thought提供了两个主要的分析:time series analysis及customer profiling,time series analysis寻找周期性的行为趋势,而customer profiling处理人口统计资料,例如,预测一顾客是否会购买一特定的产品Scenario是设计用来分类及结合问题;它可以找出一资料组中变量间的关系,Scenario使用Chi-squared Automatic Interaction Detection(CHAID),且可以产生多种对预测变量划分的方法,Scenario提供不同的分析策略、自动取样及决策树的产生,然而,Scenario并不是用来处理分类的目标变量,Scenario在资料探测及可视化是十分强大的Scenario及4Thought的共同优点是他们广泛且直觉的使用者接口,他们的目标锁定在初学者,它使用绘图表示univariable analysis或decision tree metaphor,且提供一良好的视觉表达方式来表现在区域间的资料变量,趋势分析及相关因素,Scenario有一template可分析从竞争及每季获利信息Cognos表示它将以它的PowerPlay(OLAP)及Impromptu(reporting)应用软件整合4Thought及Scenario.
Darwin(Oracle)
Darwin常被认为是最早资料探勘工具之一,可见它的知名度,最近,Oracle从Thinking Machines公司取得Darwin来加强它的产品系列S别是CRM方面,资料探勘可以扮演一个重要的角色,以下将讨论由Thinking Machines公司发展和行销的Darwin之特色(Oracle也许决定改变任何组件及工具架构) Darwin资料探勘工具组是一个复杂的产品,包含了三个资料探勘工具:neural networks、decision tree、和K-nearest neighbor,Darwin neural network tool (Darwin-Net)提供广泛的model建立工具组,它可以处理明确和连续预测因素和目标变量且可以用于分类、预测及预测问题决策树工具(DarwinTree)使用CART算法,且可以用于以明确和连续变量来分类问题解决,K-nearest neighbor工具(DarwinMatch)可用于以明确相依变量,和明确且连续预测变量来分类问题解决虽然每个组件工具有一些缺点,Darwin包含了模式评价的完全功能组,它可对所有模式型态产生summary statistics、confusion matrices、lift tablesDarwin提供初学者及专家相当好的使用者接口,虽然接口显得较适合专业使用者从一个大量并行计算机的第一制造者可知,Darwin在处理效能及范围有强大的优势,它的算法对并行计算是最适合的,且有足够的弹性执行平行及循序架构,Oracle当然不会忽视这种能力,且它定位在帮助Oracle成为可以包含到一个大型的全球企业的数据库及应用产品的首要厂商主要使用的算法为neural network、decision tree、和K-nearest neighborneural network-training algorithms包含back propagation,steepest descent,modified Newton等方法decision tree使用CART algorithms可选择所需的子树数目自动的修改决策树K-nearest neighbor algorithm是memory-based reasoning(MBR)技术,它可依训练组中K最接近的匹配记录来预测相依变量值结论Darwin的优点是支持多重算法(计画加入基因算法及人工智能逻辑)它可在多种主从式架构上执行,服务器端可以是单处理器、同步多处理器或大量平行处理器,在多处理器服务器上,Darwin可以取得硬件及大范围能力的优势,Darwin证明了强大的效能及大范围的能力,整体而言,Darwin定位在中、大范围的执行.
Database Mining Workstation(HNC)
HNC是最成功的资料探勘公司之一,它的Database Mining Workstation(DMW)是一种广为接受的信用卡诈骗分析应用的neural network tool,DMW由Windows-based software applications和custom processing board所组成,其它HNC产品包含Falcon和ProfitMax在财务服务及HNC打算要在通讯业中扩张的Advanced Telecommunications Abuse Control System (ATACS)诈骗侦测解决方案之应用 DMW neural network支持back propagation neural network且可以自动及手动的模式来作业,它的模式可以使用广泛的统计和计算预测变量和对一相依变量的敏感度之相关性的功能来解释DMW提供大量的使用者定义选项允许在算法修改、资料准备、和操作函式上有很大的弹性,DMW有效的处理明确且连续的变量,并且可以用于预测、分类、及预测问题,DMW提供初学者及有经验使用者包含进阶调整选项及描述能力之接口,DMW也提供可用于直销活动的商业templateDMW在产生精确及有效预测模式上是十分优异的,它的处理效能及范围足以支持主要的信用卡处理需求结论DMW是强大、成熟的产品,且市场接受度非常好,它的诈骗侦测/分类应用可用于实时分析信用卡交易,这是它在范围及效能上最好的证明.
上一篇:利用SAS进行分层随机抽样 下一篇:临床试验的SAS统计报表问题
共3页: 上一页 1 [2] [3] 下一页