开启主要内容

港大研究转化商用 CISC 网络爬虫分析网络舆情(PCM 电脑广场 20210130)

2021年02月09日

返回新闻

港大研究转化商用 CISC 网络爬虫分析网络舆情

PCM 电脑广场 20210130 

1

网民集合的力量,在 Reddit 的 r/WallStreetBets 击退沽空 GameStop 的炒家发挥至极。网民在讨论区和社交网络的讨论影响品牌形象,但商户却无法分析留言。香港大学计算机科学系副教授邹锦沛研究网络爬虫技术多年,透过技术转移处将研究成果转为商用,成立创业公司 CISC ,推出艾慧思( IaaS )服务,企业藉此分析网络舆情。

邹锦沛专问研究网络犯罪和电脑取证,同时身兼港大资讯保安及密码学研究中心主任,早在 2005 年与香港海关研发「网线监察系统」,追踪网上 BitTorrent 发放侵权档案。他解释,该系统通过规则为基础的爬虫技术,自动搜集网上的 BT 种子加以分析是否属侵权内容。当年用此系统所得的证据,拘捕外号「古惑天皇」的陈乃明,成为全球首宗用 BT 上载被控侵权案例。

邹锦沛基於此系统为海关开发更多网上智能情报分析技术,如分析互联网图片和文字,追踪网上售卖假货活动。之后更升级成追踪社交平台的「网讯 」( SocNet System ),打击商户在社交平台销售侵权货品。

他指出,同一技术应用在分析商业品牌大有潜力,於是在 2016 年成立创业公司 CISC ,把该技术转为企业的网络服务艾慧思。

艾慧思加入自然语言处理( NLP )、深度学习影像分析等人工智能技术,分别从 Facebook 、 Instagram 等社交网络,以及网上讨论区搜集公共数据,经分析整理找出内里的智能讯息。邹锦沛表示,所产生的智能讯息可以用於保护知识产权、调查网络罪案,而最广泛用途便是商业智能分析。「通过分析语意,了解评论属正评或负评,有助企业品牌掌握用户的情绪。」

该平台亦可按企业的需要,自动追踪个别议题,当网络舆论转风向,及早作出提示。

然而在研究成果转化的过程充满挑战,邹锦沛获港大技术转移处( TTO )协助,从过去的研究技术变成推出市场的商业服务。他表示,研发技术与商业社会始终有一定差距, TTO 提供支援,了解市场的需求。

他举例,设计用户友善的介面是重要一环。过去为海关所开发的系统,训练专人操作,用户介面设计可以较复杂。惟推出市场的服务由用户自助使用,介面设计要求简单易用,因此聘试专人设计。

由於过去与特区政府多个部门合作, CISC 首批客户都是部门和院校为主,正在开拓更多商业市场。他表示,过去有海关的成功案例,有助加强客户的信心。事实上,艾慧思还在扩展功能,更贴近企业客户追踪品牌的需要,例如爬虫系统加入人工智能,从数据发掘更多资讯。

 

阅读原文:https://www.pcmarket.com.hk/20210129-hku-technology-transfer-office-cisc-web-spider-analysis-opinion-in-internet/

骨質疏鬆長者福音 內植物助骨折癒合 (星島日報創科廣場 IT SQUARE) 2020年11月4日

2020年11月05日

返回新闻

返回新闻

政府懶理 港大擬自設工廠 專家籲港產疫苗納入特區戰略儲備 (HK01 2020年10月27日)

2020年10月28日

电子通讯

获取最新技术和新闻

标有星号 (*) 的字段为必填项

如果您不希望再收到我们的电子邮件,您可以发送取消订阅的请求至info@tto.hku.hk.