返回
顶部

在线报名 Stata夏季训练营-机器学习与Stata、R应用研讨会-陈强专场

Stata夏季训练营暨“机器学习与Stata、R应用研讨会”将于2019年8月17日至19日在上海财经大学举办。即日起开始正式报名,欢迎广大Stata用户积极参与! >>第三届Stata中国用户大会

精华内容抢先看

本次训练营邀请山东大学陈强教授作为主讲嘉宾,采用Stata16 最新版本演示。为陈强教授亲授课程,全程三天,共(十八)课时,提供电子讲义及数据案例资源。机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。 本课程主要介绍机器学习的基本思想与算法,并结合具体案例,介绍Stata和R语言实践操作。

StataCorp LLC推荐课程

自1985年1月,Stata 1.0发布,三十多年来,StataCorp一直是统计软件的领导者,致力于提供专业研究人员分析数据所需的工具。 本次,由StataCorp LLC重点推荐的“机器学习与Stata应用研讨会 ”将提供机器学习里最受欢迎热门知识,思想原理 + 数学精髓 + Stata案例。 全程(含会议)八天魔鬼训练营,这个夏天魔都上海,就等你来!

陈强老师亲授课程

陈强教授自2010年《高级计量经济学及Stata》教材出版以来,受到了广大读者的热烈欢迎。 本次“机器学习与Stata、R应用研讨会”,陈老师将会带来全新、不一样的内容。主要指导思想是在最前沿的技术及Stata更深入的探究上,将机器学习的思想原理结合Stata的精髓及核心内容,以最通俗生动的语言以及大量的案例教给学员,并注重在应用上的扩展。课前我们将提供电子版本讲义及课件资源。

Stata最新版V16演示

机器学习是人工智能科学研究和应用领域的重要驱动力, 同时也给统计研究带来了众多挑战和思路,而Stata正是集中探讨和解决这些问题的最佳软件。Stata以其友好的人机界面,简单的编程语言和强大的功能,赢得了越来越多专业人士的关注和认可。 本次训练营,由友万科技为所有参加培训的用户提供Stata16 最新正版软件试用,确保每位老师都能正常、安全的运行数据资源,保证上课质量!

最前沿的知识体系,带你一探究竟

近年来人工智能迅速进入大众视野,并在全球范围内迎来了行业的快速发育期。机器学习作为人工智能的组成部分,无疑是人工智能科学研究和应用领域的重要驱动力,将带来一系列传统决策机制的根本性变革,势必推动社会科学研究范式的重大转型。 机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。 本课程主要介绍机器学习的基本思想与算法,并结合具体案例,介绍Stata和R语言实践操作。



  • OLS的代数与几何
    统计推断
    标准误(稳健、HAC、聚类、自助)

  • 逻辑回归
    Logit回归、边际效应、几率比
    ROC、AUC

  • 决策树(Decision Tree)
    CART算法、分裂准则函数
    剪枝(Pruning)、交叉验证

  • 集成学习(Ensemble Learning)
    袋装法(Bagging)、随机森林
    提升法(Boosting)、变量重要性、偏依赖图

  • 人工神经网络
    激活函数、反向传播算法
    神经网络的训练、深度神经网络

  • 支持向量机
    最大间隔分类器(Maximal Margin Classifier)
    软间隔(Soft Margin)、核技巧



主讲嘉宾介绍

陈强,山东大学教授,分别于1992年与1995年获得北京大学经济学学士与硕士学位,2007年获美国Northern Illinois University数学硕士与经济学博士学位。现任山东大学经济学院博士生导师。主要研究领域为计量经济学、经济史。已独立发表论文于Oxford Economic Papers (lead article),Economica,Journal of Comparative Economics,《经济学(季刊)》、《世界经济》等国内外期刊。著有畅销研究生教材《高级计量经济学及Stata应用》(第2版,高教社,2014)与本科教材《计量经济学及Stata应用》(高教社,2015)。2010年入选教育部新世纪优秀人才支持计划。

课程信息:
时间:2019年8月17日-19日(共三天)
安排:上午09:00至12:00 ; 下午14:00至17:00 ; 答疑17:00至17:30;
地点:上海财经大学

课 程 大 纲

第一天

第一讲 机器学习引论
第二讲 KNN 偏差与方差的权衡 、如何选择K 、验证集法 、交叉验证
第三讲 OLS (略讲) OLS的代数与几何、统计推断、标准误(稳健、HAC、聚类、自助)
第四讲 判别分析 贝叶斯决策理论、线性判别、二次判别、Fisher判别分析
第五讲 朴素贝叶斯 朴素贝叶斯、 拉普拉斯修正

第二天

第六讲 逻辑回归 (略讲) Logit回归、边际效应、几率比、ROC、AUC
第七讲 决策树 (Decision Tree) CART算法(Classification and Regression Trees)、分裂准则函数(错分率、基尼指数、信息熵)、剪枝(Pruning)、交叉验证(Cross-validation)
第八讲 集成学习(Ensemble Learning) 袋装法(Bagging)、随机森林(Random Forest)、提升法(Boosting)、变量重要性(Variable Importance)、偏依赖图(Partial Dependence Plot)

第三天

第九讲 支持向量机 最大间隔分类器(Maximal Margin Classifier)、软间隔(Soft Margin)、支持向量机(Support Vector Machine)、核技巧(Kernel Trick)
第十讲 人工神经网络 人工神经网络的思想、激活函数、反向传播算法(Back-propagation Algorithm)、神经网络的训练、深度神经网络、神经网络的类型与发展

课程详情

  • 第一讲
    机器学习引论


    专题介绍:近年来人工智能迅速进入大众视野,并在全球范围内迎来了行业的快速发育期。机器学习作为人工智能的组成部分,无疑是人工智能科学研究和应用领域的重要驱动力,将带来一系列传统决策机制的根本性变革,势必推动社会科学研究范式的重大转型。 当计量经济学的影响力几乎不出校门时,机器学习正迅速进入大众视野,并悄然改变着我们的日常生活(比如,网络搜索、网购等背后均有机器学习的算法支持)。你或许感到奇怪,计量经济学与机器学习有可比性吗?当然有!

  • 第二讲
    KNN

    专题介绍:K-近邻算法(KNN)是将最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。 KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。交叉验证是一种通过估计模型的泛化误差,从而进行模型选择的方法。没有任何假定前提,具有应用的普遍性,操作简便, 是一种行之有效的模型选择方法。K折交叉验证:把数据分成K份,每次拿出一份作为验证集,剩下k-1份作为训练集,重复K次。最后平均K次的结果,作为误差评估的结果,此方法大大减小算法复杂度,被广泛应用。

  • 第四讲
    判别分析

    专题介绍:贝叶斯决策论是解决模式分类问题的一种基本统计途径。其假设:决策问题可以用概率的形式来描述,并且所有有关的概率结构均已知,叶斯决策论是基于概率论的决策,根据不同决策准则,分别得到不同决策意义下的最优判断。由于线性判别函数易于分析,所以关于这方面的研究特别多。 应用统计方法解决模式识别问题时,一再碰到的问题之一是维数问题。在低维空间里解析上或计算上行得通的方法,在高维空间里往往行不通。因此,降低维数有时就成为处理实际问题的关键。

  • 第三讲
    OLS

    专题介绍:OLS(最小二乘法)主要用于线性回归的参数估计,它的思路很简单,就是求一些使得实际值和模型估值之差的平方和达到最小的值,将其作为参数估计值。OLS的最大好处是便于解释,容易考察解释变量 x 对被解释变量 y 的影响。虽然OLS估计非常简单,但在进行统计推断时,却需要特别注意在不同的场合下使用不同的标准误,比如稳健标准误,HAC标准误,聚类稳健标准误,自助标准误等。

  • 第五讲
    朴素贝叶斯


    专题介绍:朴素贝叶斯算法简单高效,在处理分类问题上,是首先考虑的方法之一。其优点为简单、快速、有效。能处理好噪声数据和缺失的数据,需要用来训练的例子相对较少,但同样能处理好大量的例子,很容易获得一个预测的估计概率值 。 本讲将主要讲解朴素贝叶斯通过拉普拉斯修正,可以避免因训练集样本不充分而导致概率估值为零的问题,对算法的思考以及应用的消息,培养思维能力,注重过程,挖掘背后的原理。

  • 第六讲
    逻辑回归


    专题介绍:逻辑回归由于存在易于实现、解释性好以及容易扩展等优点,被广泛应用于点击率预估(CTR)、计算广告(CA)以及推荐系统(RS)等任务中。 ROC/AUC作为机器学习的评估指标非常重要, 为了了解模型的泛化能力,我们需要用某个指标来衡量,这就是性能度量的意义。有了一个指标,我们就可以对比不同模型了,从而知道哪个模型相对好,那个模型相对差,并通过这个指标来进一步调参逐步优化我们的模型。 本讲我们主要讨论与分类相关的一些指标,因为AUC/ROC就是用于分类的性能度量标准。

  • 第八讲
    集成学习
    (Ensemble Learning)

    专题介绍:集成学习的理论基础是 PAC 理论、强可学习与弱可学习理论。集成学习的理论基础表明强可学习器与弱可学习器是等价的,因此可以寻找方法将弱可学习器转换为强可学习器,而不必去直接寻找较难发现的强可学习器。本次课程陈教授将带我们一起探讨具有代表性的集成学习方法包括Boosting,Bagging,随机森林等。

  • 第七讲
    决策树
    (Decision Tree)

    专题介绍: 机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。其中CART算法(Classification and Regression Trees)分类与回归树(CART——Classification And Regression Tree)) 是一种非常有趣并且十分有效的非参数分类和回归方法。它通过构建二叉树达到预测目的。 剪枝(Pruning)是决策树停止分支的方法之一。除此之外,课程中还将对分裂准则函数(错分率、基尼指数、信息熵)、交叉验证(Cross-validation)做详细讲解。

  • 第九讲
    支持向量机

    专题介绍:支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)。 SVM被提出于1964年,在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法,在人像识别(face recognition)、文本分类(text categorization)等模式识别(pattern recognition)问题中有得到应用 。本课程将重点解析最大间隔分类器(Maximal Margin Classifier)、软间隔(Soft Margin)及核技巧(Kernel Trick)等支持向量机方面的核心内容。

  • 第十讲
    人工神经网络

    专题介绍:人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在学术界也常直接简称为神经网络或类神经网络。 最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。本课程将详细介绍人工神经网络的思想、激活函数、反向传播算法、神经网络的训练等内容,同时陈老师也会和大家一起探讨关于神经网络的类型与发展等问题。


培训对象


国内高校教师、硕士生、博士生、科研院所科研人员、社会团体及Stata爱好者。

报名方式


请填写表格后于2019年8月15日前,发送“报名回执表+支付截图”至邮箱:marketing@uone-tech.cn,邮件主题为:“2019 Stata夏季训练营+姓名+单位”完成报名及缴费。(如现场刷卡需预缴500元留位费至主办方指定帐户,现场刷卡后以现金方式返还)

第三届Stata中国用户大会及Stata夏季训练营(优惠方案)

会议名称 会议时间 原价 9折 8.5折 8折
第三届Stata中国用户会议 2019.08.20-21 800 720 680 640
Stata夏季训练营(陈 强专场) 2019.08.17-19 3600 3240 3060 2880
Stata夏季训练营(王群勇专场) 2019.08.22-24 3600 3240 3060 2880
  合计: 8000 7200 6800 6400
优惠方案
全程班(夏令营二场+用户会议) 8天 8000 \ \
半程班(夏令营一场+用户会议) 5天 4400 \ \
友万用户(参加培训或者采购软件用户) 任意 依选择计算 \ \
报名优惠(同一单位3人以上) 任意 依选择计算 \ \
报名优惠(同一单位5人以上) 任意 依选择计算 \ \
单独报班无优惠(友万用户除外) 任意 依选择计算 \ \ \
备注:
1.以上优惠方案不同时适用,但可以选取最优方案执行。
2.缴费方式可以通过银行电汇和现场刷公务卡方式缴纳,(现场刷卡需交500元留位费)。
3.发票开具类目为培训费/会议费,任选其一。
4.如报名后有事无法参加,请于7月30日17:00前告知,后期不接受退费。

支付方式


对公转账
开户名:北京友万信息科技有限公司
开户行:中国建设银行北京昌平支行
帐  号:11050181360009366857


其它事项


• 主办方将提供夏季训练营课程所需的Stata\MP2 V15最新版本试用程序,试用期30天。
• 请学员自带笔记本电脑并提前自行安装软件,现场课程助教负责试用软件激活。
• 本次Stata夏季训练营食宿差旅费用由学员自理,外地学员请提前安排好行程。
• 课程结束后,学员可申请由主办方“北京友万信息科技有限公司”提供的结业证书。
• 参会学员如需采购正版Stata软件,则按“软件采购优惠“中信息执行。
• 请于训练营开营前完成报名工作并及时与会务组保持沟通。

Stata软件采购优惠


北京友万信息科技有限公司作为Stata软件在中国大陆的官网指定经销商及合作伙伴,希望能给Stata中国用户提供更多服务与支持,并帮助中国用户建立完善的软件售后服务体系。如需新版本采购及老版本更新升级请联系我们,感谢您的支持与关注。定购热线:010-56451129
1、凡参加本次会议,一年内购买Stata IC/SE/MP软件单机版本,给予10%价格优惠。
2、凡参加本次会议,一年内购买Stata IC/SE/MP软件实验室版本,给予10%价格优惠并免费赠送Stata视频培训DVD学习课程一套。
3、凡参加本次会议,一年内构建包括Stata软件在内的大数据实验室软件,项目完成后免费奉送现场Stata为期三天培训券1张,并邀请免费参加年度Stata中国用户大会。
(以上优惠信息解释权归北京友万信息科技有限公司所有。)

联系方式:

邮箱: marketing@uone-tech.cn
报名热线: 010-56451128
课程咨询: 王老师:18612990364
陈老师:18600528290
注:手机/微信同号
线上咨询(QQ): 3357724577
2196837879
124932243
温馨提示:按预报名顺序排座位








相关新闻链接:
>> Stata空间计量与机器学习研讨会-王群勇教授专场
>> StataCorp LLC 官网课程推荐
>> 第三届Stata中国用户大会
>> Stata—数据统计分析软件包