统计车间
该中心统计计算(CSC)欢迎所有的研究生,工作人员和教师参加我们的统计研讨会。这些会议在Zoom和/或在希利图书馆上层(UL)的绿色实验室举行。我们的研讨会涵盖了使用统计软件,如SPSS, SAS, Stata, Excel, R, RStudio和Python。我们还提供应用统计学的主题,包括最近开发的统计方法,利用SPSS, SAS, Stata, R, AMOS, Mplus和WinBUGS等工具。每个工作坊的介绍如下:
2025年春季统计研讨会时间表
统计工作坊简介
这是一个实践研讨会,旨在使与会者掌握使用SPSS for Windows进行有意义的数据分析的技能。所涵盖的主题包括输入和读取数据,记录变量和值标签,检查个人和组数据的频率和交叉表,重新编码变量,执行独立样本t检验,以及进行简单的线性回归。
本工作坊将深入探讨先进的资料管理和统计程序,包括个案选择、结合两个档案的个案,以及连结档案与不同的资讯。统计程序包括卡方检验、单因素方差分析、重复测量分析、非参数统计、多元回归和逻辑回归。
本工作坊强调进行基本的统计分析,包括描述性统计、频率分布、卡方检验、独立样本t检验、单向方差分析、线性和逻辑回归。其他主题包括下载和安装R包、读取和写入数据文件以及创建R图形。值得注意的是,R是一个由强大的用户社区支持的免费开源软件。
这个研讨会是Stata的介绍,包括图形用户界面和直观的命令语法方法。它旨在有效地教授基本的Stata操作。涵盖的主题包括浏览数据、数据管理、描述性统计、独立样本t检验和简单线性回归模型。
本次研讨会将深入探讨高级数据管理主题,包括数据转换、重新编码变量和构造新变量。此外,它还涵盖了日志文件、do文件的使用,并进一步探讨了统计过程,如卡方检验、单向方差分析和多元线性回归,以及回归诊断和逻辑回归。
工作坊提供宝贵的技巧,以提高使用Excel进行数据分析的效率。涵盖的主题包括输入数据、组织数据和执行描述性统计、检查频率和交叉表、进行独立和配对样本t检验、相关分析和线性回归。
本次研讨会介绍了SAS系统,重点介绍了SAS DATA STEP,重点介绍了数据输入、操作、输出和汇总。课程内容包括创建SAS工作数据集和文件,从SPSS和Excel文件中导入数据,格式化变量和值标签,以及进行简单的统计操作(如PROC FREQ和PROC MEANS)。
本次研讨会探讨了PROC ANOVA和PROC GLM设计实验的分析,以及使用PROC REG和PROC GENMOD的线性和非线性回归技术。涵盖的主题包括单向和双向方差分析,简单和多元线性回归,回归诊断和逻辑回归。
这个研讨会提供了RStudio和SAGE校园平台的概述。RStudio是一个用户友好的R语言集成开发环境,与SAGE Campus一起开发,SAGE Campus是一个提供技能和研究方法在线课程的学习平台。本次研讨会涵盖了关键的R概念,包括基本数据结构、原子性、使用ggplot2绘图、回归绘图和逻辑回归。课程内容基于SAGE校区提供的课程。
本次研讨会将涉及从约翰霍普金斯大学系统科学与工程中心和马萨诸塞州公共卫生部下载各州和马萨诸塞州的COVID-19数据。我们将利用预测、tseries、spdeep、maptools和ggplot2等R软件包,采用时间序列和空间回归模型对COVID-19数据进行分析。此外,本研讨会将演示如何使用R为COVID数据生成报告。
本工作坊介绍结构方程建模(SEM)的技术。扫描电镜是用来测试观察(测量)和未观察(潜在)变量之间的复杂关系。涵盖的主题包括基础SEM, SEM符号,路径图,数据准备,中介分析,路径分析,参数估计和模型拟合评估。使用AMOS和R进行举例说明。
第二个SEM研讨会将深入探讨高级主题,包括测量误差,潜在变量分析,探索性因子分析(EFA),验证性因子分析(CFA),结构方程模型的开发与估计,以及模型检验。此外,本研讨会还介绍了纵向数据的潜在增长模型。利用R程序和AMOS对模型结构、参数估计和模型修正进行了演示。
本课程概述了多层/分层线性模型的基本原理。主题包括需要适当的方法来建模依赖关系(例如,学校内学生的聚类),制定和解释两级多层模型及其相关参数,以及使用SPSS来估计模型参数。
本讲习班涵盖了使用SAS中的PROC power程序进行各种统计比较和测试的样本量确定和功率估计。
本次研讨会涵盖了缺失数据机制,非随机选择偏差分析,以及使用SAS和Stata的单次和多次插入(MI)方法。丢失数据是各种数据集中的常见问题。大多数统计软件包会自动从分析中剔除缺失数据的整个案例,这可能导致样本量低和结果有偏差。
这是一个统计学习的介绍性研讨会,重点是现代数据分析的重要元素,如回归和分类方法。涵盖的主题包括线性和逻辑回归,线性判别分析,交叉验证,主成分和聚类。本研讨会中的数据分析示例使用R进行演示。
这个研讨会介绍了空间建模,探索工具,如R的maptools和spdeep包。工作坊涵盖了基本的主题,包括在R中的空间数据可视化,理解空间自相关,空间依赖性的统计方法,创建空间权重,以及建立空间回归模型。
这个研讨会强调时间序列分析的实际方面。方法分层介绍,从术语和探索性图形开始,移动到描述性统计,并以实际建模程序结束,包括如何选择合适的时间序列预测方法,拟合模型,评估其性能,并将其用于预测。它侧重于最流行的业务预测方法:回归模型,平滑方法,包括移动平均(MA)和指数平滑,以及自回归(AR)模型。在研讨会的每个阶段都说明了在R中的实际实现。
SAGE校园是一个学习平台,提供为技能和研究方法设计的在线课程。这些完全自定进度的课程以视频内容、互动元素和形成性评估的迷人组合为特色。这个研讨会提供了SAGE校园课程的概述,并指导学生建立一个帐户,注册SAGE校园课程。会议将以SAGE在线课程“R入门”为例。
本次研讨会使用SPSS介绍了生存分析的统计方法,特别关注结果是事件时间变量的研究。它涵盖了使用生命表和Kaplan-Meier方法估计生存时间,以及建模生存风险。它还使用Cox回归模型评估了风险因素与生存时间之间的关系。使用SPSS 28.0进行数据分析。
这是一种因果推理研究设计方法,用于分析特定事件在特定时间段内对特定结果或感兴趣的变量的影响。该事件可被视为差分分析(DiD)中的治疗,并且可以通过比较治疗组和对照组之间随时间的结果变化来评估影响的动态。本研讨会将使用各种R包,特别是fixest、plm和用于事件研究回归的did。涵盖的主题包括数据准备、DiD分析、动态DiD模型和动态事件效果的图形显示。
这个研讨会提供了一个在ChatGPT的帮助下有效地进行统计测试的实践指南。研讨会涵盖了ChatGPT的基础知识,并展示了它在协助研究人员进行统计分析方面的实用性,包括编程和解释结果。主题包括使用t检验、单因素方差分析、卡方检验和线性回归。本综合指南旨在为参与者提供知识和技能,以便在各种统计场景中利用ChatGPT的功能。