學科專業
陳智能教授學術報告預告
時間:2022-08-28 訪問量:
場景文本識别:從視覺識别到視覺—語言交互
2003网站太阳集团将于2022年8月29日周一上午10:30在逸夫樓210舉行跨媒體計算領域的線下學術報告會,敬請光臨!
報告題目:場景文本識别:從視覺識别到視覺—語言交互
報告人:陳智能,複旦大學計算機科學技術學院青年研究員
報告時間:2022年8月29日周一10:30~11:30
報告摘要:
場景文本識别旨在識别自然場景中拍攝的圖像文本,将其中的文字區域轉化為計算機可讀取和編輯的符号,其多年以來一直是計算機視覺領域的重要研究問題,廣泛應用于圖像搜索、自動駕駛等諸多任務中。本報告聚焦深度學習時代,場景文本識别方法從單純利用字符級視覺特征,到利用文本行視覺特征,再到視覺和語言聯合建模的發展演進過程。通過對近年來其中的代表性方法進行介紹,引導聽衆建立場景文本識别領域的技術概貌。