爬虫查个人信息「怎么用爬虫收集信息」
今天给大家普及一下爬虫查个人信息「怎么用爬虫收集信息」相关知识,最近很多在问爬虫查个人信息「怎么用爬虫收集信息」,希望能帮助到您。
“很后悔自己不懂法,经检察官教育后我知道开展征信业务不合规,我公司是在没有得到被查询人授权的情况下收集个人信息,还从上游公司购买信息,经数据整合后卖给下游公司从中获利,当时我没考虑这么多……”近日,经上海市浦东新区检察院提起公诉,法院以侵犯公民个人信息罪判处被告人刘某、黄某等8人有期徒刑三年,缓刑三年至有期徒刑一年,缓刑一年不等,各并处罚金3万元至1万元不等。该团伙中的戴某等其余4人还在审理中。
刘某等12人都是上海某信息科技公司员工,该公司在没有取得国家有关部门的批准下,开发了一个征信网站,有偿为客户公司提供个人信息查询服务。
该公司的个人信息数据从哪儿来呢?据刘某等人供述,来源主要有两种,一是从上游公司购买;二是利用公司开发的“爬虫”技术爬取各类网站、社保、公积金、手机App等网络上的个人数据信息,两种渠道获取的信息经过整合储存在公司租赁的服务器内,供客户根据需要进行查询,每类信息一次查询费用0.5元至1.5元不等。
该公司声称目前只做对公业务的个人数据查询,客户多为小额贷款公司和招聘公司。有个人信息查询需求的企业需要先在该公司网站完成注册认证,注册认证需要预先充值至少2000元,并提交营业执照等信息。
“企业注册时提供的营业执照我们会在网上查询是否一致,但不会实地考察。由于没有其他系统可以审核,我们公司其实是无法审核客户是企业还是个人,确实存在个人来查询相关数据导致数据外泄等风险。”李某说。
而客户使用该网站也十分便捷,根据需要查询的内容,输入相应的身份证号码、姓名、手机号码、手机验证码后进行查询,后台通过“爬虫”技术获取相应的信息之后给出反馈,快的时候只需要几分钟就能给到结果。
在使用该网站查询信息时,会弹出一份授权协议让被查询人点击“确定”表示同意,这是一个很小的对话框,想要看到冗长的详细授权内容还需专门点开“详情”。
“我们设立授权协议这一选项完全是出于规避法律风险的考量,实际上无法区分是否得到被查询人真正意义上的同意或授权,客户公司拿到个人信息后的行为已经不受我们公司约束和监督。”涉案人员都知道,这只是公司设计出的规避法律风险的手段,因为被查询人一般都在网络上向小额贷款公司贷款或者向招聘公司投递简历,不会实际上出现在这些放贷、招聘公司,也不知道有这样一个网站,往往都是放贷、招聘公司的相关人员在操作,根本无法做到取得被查询人真正意义上的授权和同意。
经查,该公司通过签订合作协议等方式和3000余家上下游公司达成合作框架,用自行开发的“爬虫”技术在互联网上爬取身份证、社保、公积金、出行、社交、消费能力、通信记录、电商消费记录等各类公民个人信息共计308万余条,通过有偿提供查询服务违法所得共计1750余万元。
检察官提醒公众,随着信息网络的发达,公民个人信息的保护越发受到人们的重视,违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的行为将会被判处刑罚。目前,经过中国人民银行审批通过,可从事个人征信业务的机构只有中国人民银行征信中心和百行征信有限公司,切莫为了私利触碰法律红线。(检察日报 张馨月)