港大研究转化商用 CISC 网络爬虫分析网络舆情(PCM 电脑广场 20210130)
2021年02月09日
Back to 新闻港大研究转化商用 CISC 网络爬虫分析网络舆情
PCM 电脑广场 20210130
网民集合的力量,在 Reddit 的 r/WallStreetBets 击退沽空 GameStop 的炒家发挥至极。网民在讨论区和社交网络的讨论影响品牌形象,但商户却无法分析留言。香港大学计算机科学系副教授邹锦沛研究网络爬虫技术多年,透过技术转移处将研究成果转为商用,成立创业公司 CISC ,推出艾慧思( IaaS )服务,企业藉此分析网络舆情。
邹锦沛专问研究网络犯罪和电脑取证,同时身兼港大资讯保安及密码学研究中心主任,早在 2005 年与香港海关研发「网线监察系统」,追踪网上 BitTorrent 发放侵权档案。他解释,该系统通过规则为基础的爬虫技术,自动搜集网上的 BT 种子加以分析是否属侵权内容。当年用此系统所得的证据,拘捕外号「古惑天皇」的陈乃明,成为全球首宗用 BT 上载被控侵权案例。
邹锦沛基於此系统为海关开发更多网上智能情报分析技术,如分析互联网图片和文字,追踪网上售卖假货活动。之后更升级成追踪社交平台的「网讯 」( SocNet System ),打击商户在社交平台销售侵权货品。
他指出,同一技术应用在分析商业品牌大有潜力,於是在 2016 年成立创业公司 CISC ,把该技术转为企业的网络服务艾慧思。
艾慧思加入自然语言处理( NLP )、深度学习影像分析等人工智能技术,分别从 Facebook 、 Instagram 等社交网络,以及网上讨论区搜集公共数据,经分析整理找出内里的智能讯息。邹锦沛表示,所产生的智能讯息可以用於保护知识产权、调查网络罪案,而最广泛用途便是商业智能分析。「通过分析语意,了解评论属正评或负评,有助企业品牌掌握用户的情绪。」
该平台亦可按企业的需要,自动追踪个别议题,当网络舆论转风向,及早作出提示。
然而在研究成果转化的过程充满挑战,邹锦沛获港大技术转移处( TTO )协助,从过去的研究技术变成推出市场的商业服务。他表示,研发技术与商业社会始终有一定差距, TTO 提供支援,了解市场的需求。
他举例,设计用户友善的介面是重要一环。过去为海关所开发的系统,训练专人操作,用户介面设计可以较复杂。惟推出市场的服务由用户自助使用,介面设计要求简单易用,因此聘试专人设计。
由於过去与特区政府多个部门合作, CISC 首批客户都是部门和院校为主,正在开拓更多商业市场。他表示,过去有海关的成功案例,有助加强客户的信心。事实上,艾慧思还在扩展功能,更贴近企业客户追踪品牌的需要,例如爬虫系统加入人工智能,从数据发掘更多资讯。
E-Newsletter
Get the latest technology and news from us
If you do not wish to receive emails from us in the future, you can send an unsubscribe request to us by email to info@tto.hku.hk.