前言:本站為你精心整理了人工智能書刊中符號和公式編排探思范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
摘要:當前,新一代人工智能正在全球范圍內(nèi)蓬勃發(fā)展,帶來人工智能類書刊文章近幾年以幾何級倍數(shù)增加。本文針對國內(nèi)人工智能類書刊文章中符號和公式編排的常見問題,結(jié)合國家標準進行思考并給出規(guī)范的表達方式,以期對作者和出版社編輯有所啟發(fā),提高相關(guān)出版物的質(zhì)量。
關(guān)鍵詞:人工智能;書刊文章;符號;公式;編輯加工
導語
當前,新一代人工智能正在全球范圍內(nèi)蓬勃發(fā)展,促進人類社會生活、生產(chǎn)和消費模式巨大變革,為經(jīng)濟社會發(fā)展提供新動能,推動經(jīng)濟社會高質(zhì)量發(fā)展,加速新一輪科技革命和產(chǎn)業(yè)變革。2017年,國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,目標是搶抓人工智能發(fā)展的重大戰(zhàn)略機遇,讓我國在人工智能領(lǐng)域構(gòu)筑先發(fā)優(yōu)勢。我國頂級的IT企業(yè)和一流高校陸續(xù)成立協(xié)同創(chuàng)新中心、人工智能研究院、人工智能學院等機構(gòu)。教育方面,《新一代人工智能發(fā)展規(guī)劃》提出“實施全民智能教育項目,在中小學階段設置人工智能相關(guān)課程,逐步推廣編程教育”的要求。不少省、區(qū)、市都已經(jīng)開始探索在義務教育階段開展人工智能教育。人工智能高等教育更是走在前列。2018年,教育部印發(fā)了《高等學校人工智能創(chuàng)新行動計劃》,將完善人工智能領(lǐng)域人才培養(yǎng)體系作為三大任務之一,并積極加大人工智能專業(yè)建設力度。在這些背景下,我國的人工智能類書刊文章近幾年以幾何級數(shù)增加,給出版單位的編輯提出了新的要求和挑戰(zhàn)。從人工智能的理論基礎來看,一方面,人工智能脫胎于計算機學科,是研究使用計算機來模擬智能的科學,需要用計算機程序?qū)崿F(xiàn)這些智能應用;另一方面,當前以深度神經(jīng)網(wǎng)絡為代表的新一代人工智能又是建立在以線性代數(shù)和概率論為框架的基礎數(shù)學之上,通過在多維上簡單地組合實現(xiàn)復雜的功能。因此,在人工智能類書刊文章中不可避免地會碰到大量的數(shù)學公式、物理量符號、計算機算法和程序段代碼交織在一起的情況,給編輯加工帶來一定的困擾。本文主要談談編輯加工人工智能書刊文章中的符號和公式時遇到的幾個典型問題,并簡單進行總結(jié)和歸納。[1]
1.人工智能類書刊文章中的大、小寫
人工智能類書刊文章中的大、小寫表示,除了人名、地名、機構(gòu)等專有名詞的英文釋義需要首字母大寫,名詞英文縮寫、部分運算符號、人名引申的單位符號、集合符號等全部大寫外,其他的英文字符均建議用小寫表示。這和一般科技類書刊文章中的表示是統(tǒng)一的,下面舉幾個人工智能文章中的例子做具體說明。例1(1)Python語言、GPU、LeNet神經(jīng)網(wǎng)絡——這些都是與人工智能相關(guān)的專有名詞或?qū)S忻~縮寫,有些已經(jīng)收入相關(guān)的《專有名詞詞典》或者在“術(shù)語在線”上能查到,但也有相當一部分還沒有,但是可以按照約定俗成來表示。(2)支持向量機(supportvectormachine,SVM)卷積神經(jīng)網(wǎng)絡(convolutionalneuralnetworks,CNN)——人工智能書刊文章中出現(xiàn)的算法、方法、公式名稱的英文釋義一般全用小寫表示,縮寫一般全用大寫表示。(3)隱馬爾科夫模型(hiddenMarkovmodel,HMM)、蒙特卡洛樹搜索(Monte-Carlotreesearch)——英文釋義中涉及人名或者地名等專有名詞,專有名詞保持首字母大寫,其他單詞用小寫表示,縮寫還是全用大寫。(4)國際計算機視覺大會ICCV(IEEEInternationalConferenceonComputerVision)——頂級會議和機構(gòu)名稱的英文釋義保留首字母大寫。人工智能類書刊文章中的大、小寫表示一般是遵循約定的原則而非通用標準,所以尺度比較寬松,編輯加工中做到同一類情況全書或全文統(tǒng)一也就可以了。
2.人工智能類書刊文章中的正、斜體
2.1量和單位
人工智能類書刊文章中的量和單位首先要符合一般性的量和單位正規(guī)表達方式。[2]量的符號,包括物理量和計算過程中用到的變量,通常是單個的拉丁字母或希臘字母,都必須用斜體表示,如x,y,z,W,α,β,Θ等。有一種情況容易忽略,即變量出現(xiàn)在名詞中,如人工智能類書刊文章中會出現(xiàn)k-均值(k-mean)算法、n元語法(n-gram)模型等名詞,其中的k和n表示為變量,所以不管是在中文名稱還是英文釋義中都應該用斜體表示。單位符號則一律用正體表示,如厘米(cm)、千克(kg)等。人工智能書刊文章中還經(jīng)常會遇到計算機中常用的單位,如比特(b)、比特率(b/s)、千比特每秒(Kb/s)、字節(jié)(B)、千字節(jié)(KB)、兆字節(jié)(MB)等。特別要注意小寫k、m和大寫K、M作為SI詞頭(加在單位前的符號)的用法,一般來說,103=k,10-3=m,106=M,但在計算機二進制中還有210=K,220=M,所以要根據(jù)上下文的準確意思來標注單位符號。人工智能書刊文章中的單位符號還有幾個通用原則需要遵循。(1)作為科技書籍或文獻,單位符號一般應全部使用英文符號,不能中文英文單位混用,除非該量只有中文單位,如計數(shù)單位“元”“人”“冊”等,計時單位“時辰”“旬”等,因為沒有對應的字母符號,所以只能用中文符號。(2)多個具有共同單位的數(shù)值并列或區(qū)間表示時,可以只在最后一項數(shù)值后保留單位符號,其他數(shù)據(jù)后省略,例如,100、200、500HZ(或100,200,500HZ),100~500b/s,1991—1995年等。(3)多個數(shù)值相乘表示面積、體積、分辨率時,每個數(shù)值的單位都應該保留,例如,體積2m×5m×3m,分辨率800px×600px等。這和上文“多個具有共同單位的數(shù)值并列”是有明顯區(qū)別的,需要特別注意。
2.2函數(shù)、常數(shù)及運算符號
數(shù)學公式中常見的函數(shù)、常數(shù)及運算符號一律用正體表示,如sin,cos,∑,∏,log,ln,Δ,π,e(自然對數(shù)底)等。微分號“d”和偏微分號“?”本文認為也是運算符號的一種,所以應該用正體表示。要注意的是,不能見著符號e就把它排成正體,一定要明白它代表的數(shù)學意義,e作為字母變量時應該用斜體表示,同樣的情況還是有π,∑等,這些符號也常用作變量。人工智能用到的公式除高等數(shù)學外,還涉及統(tǒng)計學的內(nèi)容,例如統(tǒng)計機器學習部分的內(nèi)容。統(tǒng)計學的運算符號一般用斜體表示,還應注意大、小寫的表示規(guī)則,如概率計算為大寫斜體P,算數(shù)平均數(shù)計算使用大寫斜體M,總體的標準差計算用小寫斜體σ等。人工智能類書刊文章中還有一類特殊的函數(shù)——激活函數(shù),如softmax,logistic,sigmoid,tanh,ReLU等,實際處理中,作為一般的數(shù)學函數(shù)對待,不管是在正文中還是在公式中,都用正體表示。
2.3上、下標的正、斜體
一般原則是,物理量符號或者在計算過程中用到的變量符號出現(xiàn)在上、下標的時候使用斜體表示,其他均應用正體表示。[3]例2Wij,其中的ij是雙變量符號,使用斜體表示;Wi,Wo,其中i,o表示物理量的輸入、輸出狀態(tài),使用正體表示;WT,其中的T是時間變量,使用斜體表示;WT,其中的T表示矩陣的轉(zhuǎn)置,使用正體表示。人工智能類書刊文章中變量的上、下標還會用到函數(shù)符號,如果是標準數(shù)學函數(shù)或特定的函數(shù)符號,如sin(正弦),max(最大),lim(極限),exp(以e為底的指數(shù)函數(shù)),tanh(雙曲正切)等,均用正體表示。但是,很多作者也會用到自定義的函數(shù)符號做變量的上、下標,一般來說自定義的函數(shù)在公式計算中用斜體表示,因此,用作變量的上、下標時也用斜體表示,如等。
2.4計算機程序中的正、斜體
人工智能類書刊文章中還會遇到大量的程序代碼,計算機執(zhí)行程序時一般不區(qū)分正、斜體,所以程序代碼編排時不管是變量還是常量一律用正體表示。通常,為表述一致,程序段的注釋部分(用“#”或“/*”等標注)出現(xiàn)的變量也一律用正體表示,但如果在兩個程序段中間出現(xiàn)的沒有用“#”或“/*”等標示的語句,可以認為是正文,其中出現(xiàn)的變量還是要用斜體表示。
3.人工智能類書刊文章中的黑、白體
3.1矢量、向量、張量和矩陣
《量和單位國家標準實施指南》[4]中規(guī)定:矢量、向量、張量和矩陣用黑斜體表示。人工智能類書刊文章中的公式會大量用到向量、張量、矩陣,但作者在寫作的時候往往會忽略標注黑體,編輯因為專業(yè)知識的限制,有時也很難判斷某些量是標量還是向量、矩陣、張量。[5]簡單的方法就是從上下文信息判斷出某些量的屬性,例如,判斷矩陣的直觀方法有轉(zhuǎn)置(T)、取模(║·║)等運算,再由這些已知的量推導出其他量的性質(zhì)。但是,人工智能類書刊文章中大部分的量都無法這么簡單判斷,本文根據(jù)編輯此類書刊文章的經(jīng)驗以及與相關(guān)作者的交流溝通,以機器學習和神經(jīng)網(wǎng)絡為例給出一些編輯加工思路。單特征的回歸網(wǎng)絡,本質(zhì)上就是一元線性問題,其計算公式就是一個線性方程:zi=xi·w+bw和b都是一個標量,每個特征x對應一個輸出z,所以都是白體。多特征的回歸網(wǎng)絡,其計算公式也可以簡單歸納為一個線性方程:Z=WTX+B其中,X=,即多個特征向量的矩陣,所有都是黑體。往后,更復雜的計算模型,例如多特征的多分類問題以及深度學習問題,樣本數(shù)肯定大于2,甚至是多維數(shù)據(jù),所以輸入和輸出都應該是矩陣或張量,特征數(shù)也肯定多于一個,甚至是多維特征,所以特征和偏置也都是矩陣或張量,都應該用黑體表示。[6]例如,對具有n個訓練數(shù)據(jù){(x1,y1)…,(xn,yn)}的神經(jīng)網(wǎng)絡,其中(xi,yi)(1≤i≤n)分別為輸入樣本及其對應的標簽,都是向量表示。對該神經(jīng)網(wǎng)絡進行優(yōu)化,一般需要計算該神經(jīng)網(wǎng)絡的損失函數(shù),可表示為Loss(yi,f(W,xi))。其中,Loss是損失函數(shù)符號,因為是自定義函數(shù),此處用的是斜體;f(W,xi)表示參數(shù)為W的神經(jīng)網(wǎng)絡對輸入xi的預測,對卷積神經(jīng)網(wǎng)絡而言,W表示神經(jīng)元連接權(quán)重和卷積核權(quán)重等需要學習的參數(shù)。此外有個細節(jié)要特別小心,即使判定變量為向量、張量、矩陣,也不要一股腦地把此變量整個排成黑體,要注意上、下標的量的屬性。只有同樣是向量、張量、矩陣的上、下標才需要排成黑體,其余仍是白體。例如,Loss(yi,f(W,xi))中,雖然y和x都是用黑斜體表示,但下標i是用白斜體表示。
3.2集合
集合一般都是用大寫拉丁字母的白體表示,如A,B,X,Y,Z等,但某些特殊的集合符號需要用黑正體或空心正體(或花體)形式表示,如N或N(非負整數(shù)集),Z或Z(整數(shù)集),R或R(實數(shù)集)等。但要特別注意是集合內(nèi)的元素有可能是向量或張量,這在人工智能類書刊文章中非常常見,例如輸入數(shù)據(jù)集合X={x1,x2,x3,…,xn},這時,很多作者在寫書過程中容易直接把X集合標成黑體并直接代入后面算式進行計算,混淆了數(shù)據(jù)集合和數(shù)據(jù)矩陣。其實,數(shù)據(jù)集合和數(shù)據(jù)是兩個不同的概念,集合只能參與集合運算,不能參與普通運算,直接寫進公式就寫錯了。碰到此類情況,本文有如下一種編輯加工時的修改方案。定義數(shù)據(jù)集合X={x1,x2,x3,…,xn},注意X是大寫的白體,另定義小寫黑體x=(原則上另定義大寫黑體X也可以,但是同時出現(xiàn)不好區(qū)分,也使讀者疑惑)或者xi(i=1,…,n)代表數(shù)據(jù)代入公式進行運算。這里的x或xi不再表示集合而是表示數(shù)據(jù)矩陣或單個數(shù)據(jù)向量、張量。可見,符號和公式的正、斜、黑、白體看似不起眼,實則非常重要,有時不僅僅是規(guī)范性問題,還是科學性問題。[7]
4.公式、算法偽代碼和程序段混排中的處理
能正確標注公式中的正、斜、黑、白體已經(jīng)很難了,如果再碰上公式、算法偽代碼和程序段混排的情況,那就更容易混淆了。下面通過一個例子來說明本文的處理方式。例3如果使用深度神經(jīng)網(wǎng)絡來擬合動作─價值函數(shù),則該算法被稱為深度Q學習?!?,是對的估計值,……,利用梯度下降法來更新參數(shù)θ。算法參數(shù)化的Q學習算法函數(shù):DeepQLearning輸入:馬爾可夫決策過程輸出:策略π此例中的θ,從上下文來看是個多維參數(shù),必然是向量或張量,所以正文中用黑斜體表示。本文認為算法偽代碼也是正文的一種形式,只不過加入了repeat、until、for、goto這樣的偽語句(偽語句的編排向程序段靠攏,用正體表示),所以期內(nèi)的公式表述還是應該和普通正文表述保持一致。所以此例中出現(xiàn)的θ都統(tǒng)一用黑斜體表示。如果算法偽代碼后面還接了一段Python程序,其中定義了同一個變量θ,按照前文所述原則,程序內(nèi)的θ按照正白體處理。[8]
5.小結(jié)
以上分析了人工智能類書刊文章中常見的符號使用和公式編排問題,并給出了規(guī)范性的思考。但符號和公式使用的實際情況要復雜得多,特別是人工智能涉及的公式都是抽象公式,其中變量的一符多用或多符共用的情況普遍存在,用好用準并不容易。作者和編輯要在熟悉規(guī)范的前提下,根據(jù)知識內(nèi)容的實際情況,準確表達,一起提高此類書刊文章中符號和公式使用的規(guī)范性,提高成果質(zhì)量,為我國新一代人工智能的發(fā)展保駕護航。
參考文獻
[1]國家技術(shù)監(jiān)督局.GB3100~3102–93量和單位[M].北京:中國標準出版社,1993.
[2]國家技術(shù)監(jiān)督局.量和單位國家標準實施指南[M].北京:中國標準出版社,1996.
[3]陳天驕,劉江,黃韜.人工智能在網(wǎng)絡編排系統(tǒng)中的應用[J].電信科學,2019(5):9-16.
[4]姚瓊.科技期刊中數(shù)學公式編排的常見問題分析[J].中國多媒體與網(wǎng)絡教學學報(上旬刊),2019(10):247-248.
[5]葉超.關(guān)于減少數(shù)學類文章編排錯誤的幾點思考[J].科技創(chuàng)新與生產(chǎn)力,2017(1):64-66.
[6]論文中公式和反應式的編排規(guī)范[J].電力系統(tǒng)及其自動化學報,2011(3):110.
[7]王萌.淺析科技期刊中數(shù)學公式編輯加工常見問題[J].中國傳媒科技,2020(9):96+104.
[8]朱建新.國內(nèi)外科技期刊中數(shù)學符號編排格式的對比分析[J].編輯學報,2019(01):34-36.
作者:韓飛 單位:高等教育出版社
人工智能 人工智能技術(shù)綜述 人工智能教育 人工智能論文 人工智能課堂 人工智能技術(shù) 人工智能的發(fā)展狀況 人工智能課程 人工智能專業(yè) 人工神經(jīng)網(wǎng)絡 紀律教育問題 新時代教育價值觀