更新時間:2024-05-02 21:06:30作者:佚名
數據科學是融合計算科學、軟件工程、統計學和各領域專業知識逐步發展起來的一門交叉學科。 過去十幾年,數據科學對整個社會科學的發展產生了革命性的影響。 除傳統計量經濟學外英語作文,政治學、社會學、歷史學等主流專業學會都成立了方法論和數據科學專業分會,并創辦了方法論和數據科學專業學術期刊。 哈佛大學、普林斯頓大學、耶魯大學、哥倫比亞大學等世界一流大學在校級建立跨學科的定量或計算社會科學研究中心和平臺,設立專門的數據科學課程和認證項目,并積極培養數據科學。 科學人才,以期促進學科融合,完善學術研究和政策研究的實證技術和數據支撐。 國內高校近年來也采取行動,搭建相應的數據科學或計算社會科學平臺。
拓展和豐富研究課題
數據科學的興起為整個社會科學特別是實證社會科學的發展注入了新的活力。 數據科學與政治科學的有機結合,使得研究以前無法深入研究的問題成為可能。 許多經典的實證研究得到了深化,也開辟了新的政治學研究課題。
新的數據采集和存儲方式讓經典政治學實證研究能夠在更大范圍、更貼近真實的政治實踐場景中進行更細致的研究。 例如,國際關系中外交互動的經典研究在很長一段時間內只能依賴于有限的傳記、回憶錄和多年后解密的檔案材料。 這不僅限制了相關研究的樣本量,也在相當程度上削弱了收集信息的即時性、有效性和可靠性。 隨著新興媒體和大數據技術的普及,國際關系學者可以輕松地利用大型且即時更新的事件數據庫——例如綜合危機預警系統(icnews)和全球事件、語言和語氣數據庫(gdelt)——客觀地詳細記錄了不同國家之間外交交往的過程和內容,進而系統考察相關國際國內政治生態和背景對上述外交交往的影響,從而極大地豐富和拓展了研究課題。
新的數據分析模型和工具使檢查許多以前無法深入檢查的問題成為可能。 例如,國際關系研究中備受關注的信號理論,長期以來依賴于學者對關鍵決策人物公開聲明的人工解讀和編碼。 這些人工解釋和編碼會很大程度上受到相關學者的主觀判斷和立場的影響,很容易引發一系列關于論點有效性和可靠性的爭論。 隨著自然語言處理(NLP)和最近興起的大語言模型(LLM)等一系列模型的發展和使用,基于機器學習和人工智能技術的分析工具往往能夠相對客觀、高效地識別主題、表達策略以及特定文本的表達策略。 情感內容。 再加上大規模的文獻數字化項目(主要針對歷史檔案和新聞記錄)和社交媒體信息的及時抓取大數據技術是學什么的,學者們可以在更大的尺度、更大的空間、更豐富的環境和更復雜的決策背景下工作。 考察國際關系中的信號傳遞、識別、解釋、反饋等一系列理論問題。
信息技術、數據和算法不僅在方法論層面深刻影響政治學的發展,而且因其對整個人類生活方式(包括政治生活方式)的巨大影響而為政治學提供了新的理論課題。 例如,社交平臺結合數據收集和特定算法,根據個人偏好有針對性地傳遞相關信息。 這一做法在相當程度上強化了國際政治傳播和外交心理學研究中本已重要的“信息繭”效應。 傳統的“信息繭”研究是從個體認知偏好的角度考察自我選擇機制及其影響。 隨著信息技術、數據和算法全面滲透到國際政治傳播中,傳統的理論模型已無法有效解釋相關的推導和動力機制。 相關理論的關注點需要超越傳統強調個人認知和行為,逐步轉向信息技術、數據和算法背后的權力分配、沖突和動態調整,從而更有效地認識“信息繭”新信息技術時代的影響。 和國際政治溝通的核心動力機制。
促進跨學科交流與合作
跨學科的交流與合作是推動學術進步的關鍵,政治學的發展亦是如此。 除了常規地借用和學習其他學科的相關理論模型和框架外,對于政治學來說,跨學科交流與合作的另一個關鍵點是方法論工具和技術。 隨著人類觀察經驗世界的技術手段不斷完善,政治學家所能考察的數據形式已經大大超出了傳統的結構化數據(如統計年鑒中的信息、世界組織提供的統計數據、抽樣調查收集的數據、 ETC。) 。 可以更輕松地獲取大量半結構化甚至非結構化數據。 這些非傳統數據中往往隱藏著重要的政治信息大數據技術是學什么的,可以用來考察豐富的政治現象。 為了有效地利用這些非傳統數據,往往需要借鑒其他學科的專業知識,如計算科學、信息技術、語言學、成像、生物遺傳學等,這正是現代數據科學的擅長之處。
與傳統政治學實證研究主要依靠統計工具和技術進行定量分析不同,數據科學自誕生之日起就帶有跨學科的印記。 在大學數據科學研究中心工作的學者往往來自不同學科,關注不同問題。 但他們有一個共同的興趣,那就是嘗試通過對不同來源、不同規模的數據進行嚴格、系統的分析來驗證和發展相關的理論模型。 這也決定了數據科學研究中心是一個跨學科的交流與合作平臺。 在這些數據科學研究中心,政治學學者往往在設定研究主題、構建理論框架、演繹實證假設、定義核心概念等方面發揮核心作用。 一旦涉及概念的操作化、測量、數據收集、模型設置和數據分析,信息技術學者擅長編程和數據存儲,語言和圖像分析學者擅長模式識別,統計學家熟悉算法設計和模型估算等,將成為不可或缺的關鍵技術支撐。
例如,國際政治學學者在考察國際組織互動網絡的形式和演化如何影響國際制度的傳播和擴散時,可以相對容易地運用經典的網絡分析模型推演不同的制度擴散情景,并推演出國際制度的可能情景。有針對性的方式。 經驗假設。 然而,為了實證識別國際組織互動網絡的不同形態和演化模式,需要利用海量數據實時記錄不同國際組織在不同網絡形態下的互動行為。 這就需要計算機領域的學者編寫專門的程序來捕獲相關信息并對數據進行結構化處理。 同時,還需要統計學者提供有效的算法進行必要的計算和估值,從而有效檢驗相關的理論假設。 同樣,如果國際關系史學家計劃系統地研究大量文本信息(歷史文獻或政府檔案),那么語言學研究人員可以提供相應的技術支持,幫助他們更有效地識別相關文本主題和不同文本。 之間的關系; 如果外交學者需要利用海量且更客觀的音頻或視頻數據(電視新聞或政治領導人的現場演講)來審視不同國家之間的外交傳播策略,那么那些專注于音頻或視頻分析的研究人員可以為以下方面提供有效的技術支持:幫助他們識別不同聲音背后隱藏的情緒,以及政治領導人不同身體姿勢背后的心理。
(作者為中國人民大學數據科學研究中心主任、國際關系學院葉成海講座教授)