数据库:
数据爬取于2022年8月31日
爬虫项目地址:https://github.com/sqwqwqw1/Chinese-Auditors-Crawler
日抛的代理ip用不完太可惜了,干脆又把这个陈年老项目跑了一遍
1 事务所信息
audit_firm.json
示例
{"会计师事务所名称": "北京中伦信会计师事务所有限责任公司", "证书编号": "11000012", "联系人": "陈旭", "联系电话": "13811780162", "办公地址": "北京市朝阳区建国门外大街丙24号8层1-5内908室", "传真": "010-65156550", "通讯地址": "北京市朝阳区建国门外大街丙24号8层1-5内908室", "邮政编码": "100022", "电子邮箱": "[email protected]", "网址": "无", "批准设立机关": "北京市财政局", "批准设立文件号": "京财协(1996)915号", "批准设立时间": "1996-09-02", "法定代表人(或执行合伙人)": "尚欣", "出资额或注册资本(万元)": "60.0", "组织形式(有限/合伙)": "有限责任", "主任会计师": "尚欣", "分所数量": "0", "合伙人或股东人数": "5", "注册会计师人数": "7", "从业人员人数": "4", "注册会计师人数(含分所)": "7", "从业人员人数(含分所)": "4", "大于70岁人数": "1", "小于等于70岁且大于60岁人数": "1", "小于等于60岁且大于40岁人数": "5", "小于等于40岁人数": "0", "博士研究生人数": "0", "硕士研究生人数": "1", "本科人数": "4", "大专及以下人数": "2", "加入国际网络": "无", "境外分支机构": "无", "是否具有内部培训资格": "否", "继续教育完成率(上一年度)": "100.00%", "处罚/惩戒信息(披露时限:自2019年至今)": "无", "被检查信息": "请点击", "参与公益活动": "无", "银行函证回函地址信息": "无"}
2 雇员信息
nwp_info.json
示例
{"所在事务所": "北京中伦信会计师事务所有限责任公司(从业人员)", "序号": "1", "姓名": "刘天虹", "性别": "女", "进所时间": "2014-11-01", "是否签合同": "是", "是否参加社保": "是", "是否党员": "否"}
3 注册会计师信息
cpa_info.json
示例
{"所在事务所": "北京中之光会计师事务所有限责任公司(注册会计师)", "序号": "1", "姓名": "马永香", "人员编号": "100000510872", "性别": "女", "出生日期": "1963-03-24", "全科合格证号(或者考核批准文号)": "04070097"}
4 注册会计师档案
cpa_profile.json
示例
{"姓名": "关晓光", "性别": "男", "所内职务": "无", "是否党员": "是", "学历": "本科", "学位": "其它", "所学专业": "商业经济", "毕业学校": "黑龙江商学院", "资格取得方式(考试/考核)": "考核", "考核批准文号": "会协(1994)第132号", "批准时间": "2015-05-08", "注册会计师证书编号": "110000202534", "是否合伙人(股东)": "否", "批准注册文件号": "京会协[2015]58号", "批准注册时间": "2015-05-08", "所在事务所": "北京华威会计师事务所有限责任公司", "本年度应完成学时": "40", "本年度已完成学时": "0.0", "处罚/惩戒信息": "无", "参加公益活动": "无"}
Comments | 5 条评论
博主 492089232
求问能不能分享一下2022年的数据,可有偿,您报价。我看您的github上好像只剩2023年的了,我们做研究正好差了一年的数据,谢谢!
博主 傲娇的小基基
@492089232 这个帖子上不是有2022年8月爬的数据么,但当时好像不是特别全,你可以试试看。
博主 窗間月夕夕成玦
@傲娇的小基基 抱歉是我眼拙之前没看到,谢谢您!
博主 傲娇的小基基
@窗間月夕夕成玦 但是这个可能不全,而且也没有我后面爬的详细,倒不如直接用2023年5月的那个。
博主 窗間月夕夕成玦
@傲娇的小基基 2023的我自己也爬啦!我们是遇到了一些因为离开了这个行业数据缺失无法匹配的情况,就需要往回找一下数据~