返回
顶部

软件试用 IBM SPSS Statistics Premium—预测分析软件

软件简介


IBM SPSS Statistics Premium Edition 集所有功能于一身的版本,专为有多种高级分析需求的大型企业而设计

IBM SPSS Statistics Premium Edition 帮助数据分析人员、规划人员、预测人员、调查研究人员、程序评估人员及数据库营销人员等在分析过程的每个阶段轻松地完成任务。它完全集成了 Statistics 功能,以及用于整个企业内各种专门的分析任务的相关产品。该软件能够显著提高生产力,有助于特定项目和业务目标取得出色成果。

软件功能


IBM SPSS Statistics Premium Edition 包括以下功能:

一、线性模型
提供各种回归和高级统计程序,旨在适应描述复杂关系的数据的固有特征。

• Statistics Premium 包含广义线性混合模型 (GLMM),用于分层数据。
• 该软件具有通用线性模型 (GLM) 和混合模型程序。
• 它包含广义线性模型 (GENLIN),包括广泛使用的统计模型,例如针对正态分布响应的线性回归、针对二元数据的逻辑模型,以及针对计数数据的对数线性模型。GENLIN 还通过其非常通用的模型公式提供众多实用的统计模型。
• 广义估计方程 (GEE) 程序扩展了广义线性模型的能力,使它们能使用关联的纵向数据和聚类数据。


二、非线性模型
能够将较为复杂的模型应用于数据。

• 多项式逻辑回归 (MLR) 可预测具有两个以上类别的分类结果。
• 二元逻辑回归可将数据分为两个组。
• 非线性回归 (NLR) 和受限非线性回归 (CNLR) 可估算非线性模型的参数。
• 概率分析使用响应比例的分对数(Logit)转换或概率单位变换来计算模拟值。


三、地理空间
分析支持用户对位置和时间数据进行集成、探索和建模。

• Statistics Premium 中的地理空间分析技术可帮助揭示地理空间数据中隐藏的关系和趋势。
• 空间-时间预测 (STP) 技术可使线性模型适应 2D 和 3D 空间内位置随时间推移进行的度量,支持用户预测这些领域的长期变化趋势。
• 使用广义空间关联规则 (GSAR) 发现空间和非空间属性之间的关联,此规则使用历史数据(例如,事件发生位置、事件类型和事件发生时间)来描述发生的事件,例如犯罪或疾病爆发。


四、模拟功能
帮助分析人员自动模拟许多可能的结果(输入不确定时),同时改进风险分析和决策制定。

• 蒙特卡罗模拟方法可以帮助您在现有数据不充分的情况下,根据现有的数据和/或已知的参数创建模拟数据集。
• 可对非数值型变量(如“男”和“女”)进行模拟,无需将其记录为数值变量。
• 现有的预测模型和数据可用作模拟的起点,包括从 Automatic Linear Modeling (ALM) 和 IBM SPSS Modeler 导出的模型。
• 生成输入数据时,会自动确定并使用分类输入之间的关联。
• 使用一组不同的随机值,反复计算结果,生成可能结果值的分布,使用户能够选择最优值。
• SPSS Statistics 可被用于分析模拟结果,以直观的形式呈现结果以及为决策者推荐的行动。


五、定制表
使用户能够轻松理解其数据,并针对不同受众以不同风格快速汇总结果。

• 包含推论性统计信息时,针对人口统计组、客户群、时间段或其他分类变量比较平均值或比例。
• 该软件可创建汇总统计信息(从针对分类变量的简单计数到离差测定),并按照使用的任何汇总统计信息对类别进行排序。
• 它包括三种主要的测试:独立性卡方测试、列平均值比较(t 测试)和列比例比较(z 测试)。
• 交互式的表构建器提供拖放功能来创建数据透视表。
• 它排除了特定类别,能显示缺少值的单元格,并将小计添加到表中。
• 表可实时预览并在创建时进行修改。表可导出至 Microsoft Word、Excel、PowerPoint 或 HTML,以便在报表中使用。


六、数据准备
简化了分析过程的数据准备阶段。

• Statistics Premium 可识别可疑或无效的案例、变量和数据值。
• 该软件允许您查看缺失数据的模式并汇总变量分布。
• Optimal Binning 为那些为名义属性设计的算法找到最佳可能结果。
• 自动数据准备 (Automated Data Preparation,ADP) 工具通过一个高效的步骤即可检测和纠正质量错误,找到缺少值的原因。
• 建议和可视化帮助您确定要使用的数据。


七、数据有效性和缺失值检查
提升了获得有显著统计意义结果的几率。

• Statistics Premium 可使用六种诊断报表从多个角度检查数据,然后估算汇总统计信息并确定缺少值的原因。
• 该软件可快速诊断因缺少数据而带来的严重问题。
• 它使您能够用估算值替换缺失的值。
• 它显示每种缺失值的类型以及每个个例的所有极值的快照。
• 通过将缺失值替换为估算值以包含所有组(甚至包括响应力较低的组)来消除隐含的偏差。


八、分类数据和数字数据
可用于预测结果并以图形方式显示关系。

• 该软件可通过感知图、双重图和三重图来发现底层的关系。
• 它使用类似于传统回归、主成份组件和典范相关的程序来预测结果并显示关系 - 帮助您处理并理解名义数据(例如,薪资)和顺序数据(例如,教育程度)。
• Statistics Premium 使您能够以可视化方式解释数据集,并在大型的分数、计数、等级、排名或相似性表中了解行与列之间的关系。
• 该软件可处理数字数据中的非标准残留数据或者预测变量(例如,客户或产品属性)与结果变量(例如,购买/不购买)之间的非线性关系。
• 提供了多种适用于数字数据和归类数据的方法,包括 Ridge Regression、Lasso、Elastic Net、变量选择和模型选择。


九、决策树
可更方便地标识组、发现各个组之间的关系和预测未来事件。

• Statistics Premium 以可视化方式确定模型的流动方式,因此您可发现特定的子组和关系。
• 该软件直接在 IBM SPSS Statistics 中创建分类树,因此,您可以使用结果直接在数据内对案例进行分段和分组。
• 它包括四种确立的树形增长算法:
① CHAID - 快速、统计型的多向树算法,用于快速有效地探索数据,并针对所期望的结果构建分段和概要信息。
② 穷举式 CHAID - CHAID 的一种变体,用于检查每个预测项所有可能的分支。
③ 分类和回归树 (C&RT) - 完整的二叉树算法,可对数据进行分区,并生成准确的同构子集。
④ QUEST - 一种统计算法,可快速有效地选择不包含偏差的变量,并构建准确的二叉树。
• 选择或分类/预测规则使用 IBM SPSS Statistics 语法、SQL 语句或简单文本(通过语法)生成。


十、预测
功能帮助您更快地分析历史数据并预测趋势。

• Statistics Premium 确保组织决策者可以理解和使用您提供的信息。
• 它会自动确定最适合的 ARIMA 或指数平滑模型来分析您的历史数据。
• 时间因果关系建模 (TCM) 技术可帮助揭示大量时间序列中隐藏的因果关系,并确定每一个目标序列的最佳预测变量。
• 一次可对数以百计不同的时间序列进行建模,而不是每次只能对一个变量建模。
• 模型集中保存至一个文件,以便在数据发生变化时可更新预测,而无需重新设置参数或者重新估算模型。
• 可编写脚本以自动使用新数据来更新模型。


十一、结构方程式建模
工具使您能够以更准确的方式构建结构方程式模型,比使用直观的拖放功能设计的标准多变量统计模型更准确。

• Statistics Premium 测试假设情况,并确认观测变量与潜变量之间的关系 - 获得比回归分析更深入的洞察。
• 它使您能够构建更能切实反映复杂关系的模型,因为无论是观测变量(例如,来自调查的非实验性数据)还是潜变量(例如,满意度和忠诚度),都可用于预测任何其他数值变量。
• 该软件的可视框架用于比较、确认并完善模型。
• 多变量分析包含并扩展了标准方法 - 包括回归、因子分析、相关分析以及方差分析。
• 该产品包含三种数据归因方法:回归、随机回归和贝叶斯算法 (Bayesian)。


十二、引导程序
简化了对模型稳定性和可靠性的测试,使生成的结果更加准确可靠。

• Statistics Premium 通过对原始样本的替换项进行重新采样,对某个估算项的采样分布进行估算。
• 它会估算填充参数(例如,平均值、中值、比例、比值比、相关系数、回归系数等)的标准误差和置信度区间。
• 该软件使您可以创建数以千计的数据集备用版本,以便进行更准确的分析。


十三、高级采样评估和测试
通过将样本设计整合到调查分析中,生成从统计意义而言更为有效的推论。

• Statistics Premium 提供处理复杂样本设计(例如,分层、分群或多阶段采样)所需的专业规划工具和统计信息。
• 由于它将样本设计整合到了调查分析中,因此可帮助您获得更理想的结果。
• 用户可使用分析和预测算法(包括预测事件的时间),在复杂的样本设计中更准确地处理数字和分类结果。
• 向导简化了计划创建、数据分析和结果说明过程。


十四、直接市场营销和产品决策工具
可帮助市场营销人员更轻松地发现适合的客户,提升营销活动效果。

• Statistics Premium 通过为相似或截然不同的客户或联系人创建集群,对这些人进行细分。
• 该软件利用一些共有特征对客户或联系人建档,以提高市场营销产品和活动的针对性。
• 它可设计倾向性分数,以确定购买可能性最高的人群。
• 测试包性能与控制包性能不相上下。
• 对营销活动的响应通过邮政编码来标识。
• 将营销活动响应数据与 Salesforce.com 集成,以跟踪商机线索和报告销售成果。


十五、高端图表(High-end charts)
使用户可以在一系列平台和智能设备上方便地创建和共享吸引人的可视化效果,并与之进行交互。

• Statistics Premium 拥有数十个内置的可视化模版,帮助您就分析结果进行沟通。
• 通过“拖放”方式创建图表,无需编程技能。
• 可以定制样式表和图形模板,以便在整个企业范围内设置新的图形标准,或与您的品牌匹配。
• 图形可部署在使用 IBM SPSS Collaboration and Deployment Services、IBM SPSS Statistics 和 IBM SPSS Modeler 的运营系统中。
• 该软件支持各种数据源,包括以定界符分隔的 IBM SPSS Statistics 数据文件以及常见的数据库源(例如,DB2、SQL Server、Oracle 和 Sybase)。


详细界面功能介绍



登录页面
重新设计了登录页面,使用户能够快速轻松地找到所需的 SPSS Statistics 功能。




样式输出界面
根据单元格值,使用条件格式化,突出显示表中的单元格背景和文本。




样式输出
将特定的属性(如颜色)应用于表单元格或行,引起用户对特定结果的注意。




Web 报告
通过智能手机和平板电脑(如 iPhone、iPad、iPod、Windows 和 Android 设备)中的 Web 浏览器,查看交互式 SPSS Statistics 报告。




热图
蒙特卡罗模拟 (Monte Carlo simulation) 在显示目标和/或输入为分类状态的散点图时,帮助您自动生成热图。




内核密度估算
在此图中,SPSS Statistics 显示了所选区域随时间变化的点密度(内核密度估算)。




GSAR
正如此处所示,GSAR 可用于基于区域人口统计信息预测犯罪发生可能性最高的地点,如此图中所示。




时间因果关系模型
此图显示了与时间因果关系模型系统中的前 10 个模型(最匹配的模型)关联的因果关系。监控关键绩效指标并跟踪各种可控指标(称为杠杆)数据的企业希望确定杠杆与 KPI 之间的因果关系,以便了解哪些杠杆影响哪些 KPI。该公司还希望了解在各 KPI 之间是否存在因果关系。



软件新功能



SPSS Statistics Premium 支持地理空间和时间序列技术
IBM SPSS Statistics Premium 包含新的分析技术,能够帮助您探索时间和空间中的数据,并制定出更好的决策。最新版本为您提供了工具,以便:

对位置和时间数据进行集成、探索和建模
• 发现时间和空间中的趋势 - 使用空间-时间预测 (STP) 技术,使线性模型适应 2D 和 3D 空间内位置随时间推移进行的度量,以便您预测这些领域的长期变化趋势。
• 创建整合地理空间属性的关联规则 - 使用广义空间关联规则 (GSAR) 发现空间和非空间属性之间的关联。它使用历史数据(例如,事件发生位置、事件类型和事件发生时间)来描述发生的事件,例如犯罪或疾病。

发现时间序列数据中的因果关系
使用时间因果关系建模 (TCM) 技术来揭示大量时间序列之中隐藏的因果关系。SPSS Statistics 支持您将许多时间序列输入 TCM中来发现其中哪些序列存在因果关系,并且自动确定每个目标序列的最佳预测变量。

从更广泛的一系列 R 编程选项中进行选择
在 SPSS Statistics 内使用功能全面的集成 R 开发环境来开发和测试 R 程序。您还可以使用 R 内部的命令语法来编写使用 SPSS Statistics 功能的 R 函数,并将结果返回至 R。

使用更广泛的分类主成份分析 (CATPCA) 功能,包括:
• 通过非参数化引导程序(bootstrapping)实现更稳定的估算
• 对除变量以外的案例进行分群
• 提供新的“rotation”选项以实现更好的汇总
• 简化使用连续变量的方式

下一代 Web 输出
SPSS Statistics Web 报告经过了彻底重新设计,可提供更多交互功能和 Web 服务器支持。

批量装入数据以加速性能
SPSS Statistics 将数据写入文本数据文件,然后批量加载程序脚本会将此文本数据重新写入数据库,在处理大型数据集时提供更卓越的性能。 最新版本还可以:
• 支持 Stata 13 用户在 SPSS Statistics 内导入、读取和写入 Stata 9-13 文件。
• 支持企业用户使用他们的员工工牌和工牌阅读器来访问软件。
• 自动确定分类输入之间的关联,并在生成输入数据时使用这些关联。可针对归入某个分类分布的所有输入计算出多向列联表,并在生成输入数据时使用。
• 在缺少预测模型的情况下生成数据,方法是指定要模拟的变量并将其归入活动数据集或者手动指定其分布。