楼主: w269750749
210 3

中国工业企业数据库 处理过程 [推广有奖]

  • 6关注
  • 4粉丝

博士生

11%

还不是VIP/贵宾

-

威望
0
论坛币
532 个
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
1521 点
帖子
48
精华
0
在线时间
421 小时
注册时间
2012-11-24
最后登录
2019-5-15

楼主
w269750749 学生认证  发表于 2019-5-10 16:34:40 |只看作者 |倒序
本帖最后由 w269750749 于 2019-5-10 16:41 编辑

软件:

用stata13处理的 打开do文档也需要stata13,否则中文会乱码。


电脑配置:

处理器越高越好,对内存要求比较大,形成最后的面板数据文件需要10个G运行内存左右(内存小会保存不了,卡死),硬盘空间所有的文件跑下来需要100多G ;本人用i7多线程的笔记本处理2多小时左右就能跑出最后数据,用i3台式机,12年老电脑,内存加到16G,大约需要6个小时左右吧。


处理数据的原则:

原始数据直接加载到stata中,所有的处理过程都用stata命令操作,用stata保存的数据不覆盖原来的数据。

这样做的好处时,(1)保持数据的原始性,所有的操作步骤都清晰可见,其实数据处理过程都会有错误出现,发现错误的时候这样可以修改stata命令后重新执行。不会出现中间手动修改后发现错误后不可复制以前的步骤。(2)之后年份数据出来之后,方便进行更新,按照思路下来是很容易合成的。


下面的文件都是dta格式的,对所有变量的代码和标签进行统一,无须再次调整
2013.txt (66 Bytes, 售价: RMB 8 元)     2012.txt (66 Bytes, 售价: RMB 8 元)
2011.txt (66 Bytes, 售价: RMB 8 元)     2010.txt (66 Bytes, 售价: RMB 8 元)
2009.txt (66 Bytes, 售价: RMB 8 元)    2008.txt (66 Bytes, 售价: RMB 8 元)
2007.txt (66 Bytes, 售价: RMB 5 元)    2006.txt (66 Bytes, 售价: RMB 5 元)
2005.txt (66 Bytes, 售价: RMB 5 元)    2004.txt (66 Bytes, 售价: RMB 5 元)
2003.txt (66 Bytes, 售价: RMB 5 元)    2002.txt (66 Bytes, 售价: RMB 5 元)
2001.txt (66 Bytes, 售价: RMB 5 元)    2000.txt (66 Bytes, 售价: RMB 5 元)
1999.txt (66 Bytes, 售价: RMB 5 元)    1998.txt (66 Bytes, 售价: RMB 5 元)

处理过程的do文档
数据处理过程 结果.txt (67 Bytes, 售价: RMB 500 元)

关键词:工业企业数据库

stata SPSS
沙发
w269750749 学生认证  发表于 2019-5-10 16:43:15 |只看作者
数据是自己处理的,整个过程很清楚,可以交流
藤椅
xfy37 发表于 昨天 21:45 |只看作者
那我的小米笔记本Air 13 ,i5-8250U ,8G内存,跑这个数据岂不是要至少3个小时了。。
板凳
w269750749 学生认证  发表于 12 小时前 |只看作者
xfy37 发表于 2019-5-14 21:45
那我的小米笔记本Air 13 ,i5-8250U ,8G内存,跑这个数据岂不是要至少3个小时了。。
跑出截面数据的话应该差不多,可以私聊整个过程
您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-5-15 23:12