新聞中心
行人識(shí)別技術(shù)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)熱門研究方向,它在很多領(lǐng)域中都有著廣泛的應(yīng)用,例如公共安全、智能監(jiān)管、自動(dòng)駕駛等。而要開發(fā)一個(gè)高效的行人識(shí)別算法,就必須先構(gòu)建一個(gè)行人識(shí)別數(shù)據(jù)庫來訓(xùn)練這個(gè)算法。而構(gòu)建一個(gè)行人識(shí)別數(shù)據(jù)庫的關(guān)鍵是如何確定正負(fù)樣本。在本文中,我們將會(huì)講解如何構(gòu)建正負(fù)樣本,以幫助讀者更好地理解并應(yīng)用行人識(shí)別技術(shù)。

創(chuàng)新互聯(lián)-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比涇川網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式?jīng)艽ňW(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋涇川地區(qū)。費(fèi)用合理售后完善,10多年實(shí)體公司更值得信賴。
一、什么是行人識(shí)別數(shù)據(jù)庫
行人識(shí)別數(shù)據(jù)庫是用來存儲(chǔ)和管理行人圖像數(shù)據(jù)的數(shù)據(jù)庫。與普通的圖像數(shù)據(jù)庫不同的是,行人識(shí)別數(shù)據(jù)庫需要包含大量的正負(fù)樣本,以供行人識(shí)別算法使用。其中,正樣本指的是包含行人的圖像,而負(fù)樣本則指沒有行人的圖像。
使用行人識(shí)別數(shù)據(jù)庫可以幫助行人識(shí)別算法更好地學(xué)習(xí)如何識(shí)別行人。因?yàn)樾腥俗R(shí)別算法需要從樣本數(shù)據(jù)中學(xué)習(xí)特征,而正負(fù)樣本的構(gòu)建可以幫助算法更好地學(xué)習(xí)樣本數(shù)據(jù)中的特征,從而更準(zhǔn)確地識(shí)別行人。
二、如何構(gòu)建正負(fù)樣本
2.1 正樣本的構(gòu)建
構(gòu)建正樣本的方法主要有兩種:手工標(biāo)注和自動(dòng)檢測(cè)。
手工標(biāo)注是將已經(jīng)包含行人的圖像標(biāo)注為正樣本。這種方法需要耗費(fèi)大量的人力和時(shí)間,但是標(biāo)注的精度和可信度會(huì)更高。手工標(biāo)注通常會(huì)采用一些標(biāo)注工具,例如標(biāo)注矩形、標(biāo)注多邊形等。標(biāo)注人員需要仔細(xì)地觀察圖像,將圖像中的行人部分標(biāo)注出來。
自動(dòng)檢測(cè)則是使用行人檢測(cè)算法自動(dòng)檢測(cè)出圖像中的行人部分。這種方法速度快,但精度和可信度會(huì)相對(duì)較低。自動(dòng)檢測(cè)模型主要會(huì)使用一些深度學(xué)習(xí)模型,例如SSD、Faster R-CNN等來進(jìn)行行人檢測(cè)。
2.2 負(fù)樣本的構(gòu)建
構(gòu)建負(fù)樣本的方法通常比較簡單,可以直接從行人數(shù)據(jù)集中刪除包含行人的圖像,或者從其他數(shù)據(jù)集中隨機(jī)選擇圖像作為負(fù)樣本。
構(gòu)建負(fù)樣本需要注意的一點(diǎn)是,負(fù)樣本要盡可能地與正樣本相似。因?yàn)樾腥俗R(shí)別算法需要學(xué)習(xí)如何判斷一張圖像中是否有行人,如果負(fù)樣本中存在太多與正樣本不同的特征,反而會(huì)降低算法的性能。因此,構(gòu)建負(fù)樣本的過程需要注意篩選,選擇與正樣本相似的圖像作為負(fù)樣本。
2.3 樣本的均衡
在構(gòu)建正負(fù)樣本時(shí),需要注意樣本的均衡。均衡是指正負(fù)樣本之間的數(shù)量應(yīng)該相當(dāng)。因?yàn)槿绻龢颖緮?shù)量遠(yuǎn)遠(yuǎn)大于負(fù)樣本數(shù)量,行人識(shí)別算法容易出現(xiàn)過擬合現(xiàn)象,導(dǎo)致算法過于關(guān)注正樣本,而無法正確識(shí)別負(fù)樣本。相反,如果負(fù)樣本數(shù)量遠(yuǎn)遠(yuǎn)大于正樣本數(shù)量,算法會(huì)過于關(guān)注負(fù)樣本,而無法正確識(shí)別正樣本。因此,樣本均衡是構(gòu)建行人識(shí)別數(shù)據(jù)庫時(shí)需要重點(diǎn)考慮的因素之一。
三、行人識(shí)別數(shù)據(jù)庫的應(yīng)用
構(gòu)建完行人識(shí)別數(shù)據(jù)庫后,它可以被用來訓(xùn)練行人識(shí)別算法。行人識(shí)別算法通常采用深度學(xué)習(xí)模型,例如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短時(shí)記憶網(wǎng)絡(luò)(LSTM)等。
行人識(shí)別算法可以被用來解決非常實(shí)際的問題,例如視頻監(jiān)控、交通管理、智能駕駛等。在視頻監(jiān)控中,行人識(shí)別算法可以自動(dòng)檢測(cè)圖像中是否出現(xiàn)可疑人員,從而提高視頻監(jiān)控的效率和準(zhǔn)確性。在交通管理中,行人識(shí)別算法可以幫助交通系統(tǒng)自動(dòng)識(shí)別行人,從而更好地管理交通流量和保障行人的安全。在智能駕駛中,行人識(shí)別算法可以自動(dòng)識(shí)別行人,從而避免車輛與行人之間的碰撞,提高行車安全性。
構(gòu)建一個(gè)高效的行人識(shí)別算法的前提是要有一個(gè)行人識(shí)別數(shù)據(jù)庫。而構(gòu)建正負(fù)樣本是行人識(shí)別數(shù)據(jù)庫中的關(guān)鍵因素,它會(huì)直接影響到行人識(shí)別算法的性能。因此,需要在構(gòu)建正負(fù)樣本的過程中仔細(xì)思考,盡可能地使正負(fù)樣本之間數(shù)量均衡,以獲得更好的算法效果。
相關(guān)問題拓展閱讀:
- 怎么把工業(yè)企業(yè)數(shù)據(jù)庫弄成面板數(shù)據(jù)
怎么把工業(yè)企業(yè)數(shù)據(jù)庫弄成面板數(shù)據(jù)
中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題 聶輝華 江艇 楊汝岱 提要:在經(jīng)驗(yàn)研究中,企業(yè)級(jí)的微觀數(shù)據(jù)正受到越來越多的重視。中國工業(yè)企業(yè)數(shù)據(jù) 庫成為海內(nèi)外學(xué)者研究中國企業(yè)行為和績效的主要數(shù)據(jù)庫之一。但是該數(shù)據(jù)庫存在樣本匹配 混亂、變量大小異常、測(cè)度誤差明顯和變量定義模糊等嚴(yán)重問題,忽視這些問題可能會(huì)導(dǎo)致 研究結(jié)果錯(cuò)誤。本文介紹了該數(shù)據(jù)庫的基本情況和使用現(xiàn)狀,指出了該數(shù)據(jù)庫的若干缺陷, 并根據(jù)現(xiàn)有研究提供了若干改進(jìn)建議。 關(guān)鍵詞:企業(yè)數(shù)據(jù) 工業(yè)企業(yè) 微觀計(jì)量 制造業(yè) 生產(chǎn)率 JEL 分類號(hào):C33 D24 L22 L60 一、引言 數(shù)據(jù)是經(jīng)驗(yàn)研究的細(xì)胞,因此數(shù)據(jù)質(zhì)量的好壞直接決定了經(jīng)驗(yàn)研究的活力。最近十多 年來,國際經(jīng)濟(jì)學(xué)界越來越重視使用微觀面板數(shù)據(jù)(longitudinal micro-level data)的研究。 相對(duì)于宏觀數(shù)據(jù)或行業(yè)數(shù)據(jù),微觀的企業(yè)數(shù)據(jù)或個(gè)體數(shù)據(jù)的優(yōu)勢(shì)是非常明顯的:之一,微觀 面板數(shù)據(jù)包含了更多信息,例如企業(yè)的所有制、規(guī)模和出口等狀態(tài),這些信息對(duì)于企業(yè)行為 研究是必不可少的;第二,微觀面板數(shù)據(jù)同時(shí)包含了時(shí)間維度和個(gè)體維度,有助于解決計(jì)量 經(jīng)濟(jì)學(xué)中的個(gè)體異質(zhì)性問題,更容易保證估計(jì)的一致性;第三,微觀面板數(shù)據(jù)增加了觀測(cè)值 個(gè)數(shù),使得估計(jì)更有效率。對(duì)于產(chǎn)業(yè)組織理論、企業(yè)理論、公司金融、國際貿(mào)易、收入分配 和勞動(dòng)供給等研究領(lǐng)域來說,經(jīng)驗(yàn)研究的數(shù)據(jù)主要就是微觀數(shù)據(jù)。 伴隨微觀計(jì)量經(jīng)濟(jì)學(xué)的引入和國內(nèi)外微觀數(shù)據(jù)庫的開放,中國經(jīng)濟(jì)學(xué)者越來越重視微 觀數(shù)據(jù)的開發(fā)和使用,并生產(chǎn)了很多基于微觀數(shù)據(jù)的研究成果。一些中國數(shù)據(jù)庫甚至被全世 界各國學(xué)者使用,這一方面表明中國問題越來越受到國際經(jīng)濟(jì)學(xué)界的重視,另一方面也表明 中國數(shù)據(jù)的質(zhì)量得到了越來越多的認(rèn)可。特別是,相當(dāng)多海內(nèi)外學(xué)者使用了“中國工業(yè)企業(yè) 數(shù)據(jù)庫”(Chinese industrial enterprises database) ① ,其研究成果廣泛發(fā)表在包括《American Economic Review》(如Song等,2023)、《Quarterly Journal of Economics》(如Hsieh和Klenow, 2023)和《經(jīng)濟(jì)研究》等國際和國內(nèi)著名學(xué)術(shù)期刊上。作為一個(gè)由中國國家統(tǒng)計(jì)局收集的 數(shù)據(jù)庫,它的優(yōu)點(diǎn)是樣本大、指標(biāo)多、時(shí)間長。但是,它畢竟不是一個(gè)由學(xué)術(shù)機(jī)構(gòu)發(fā)布的數(shù) 據(jù)庫,因此在很多方面還不太符合學(xué)術(shù)研究的嚴(yán)格要求,其缺陷包括樣本匹配混亂、指標(biāo)存 在缺失、指標(biāo)大小異常、測(cè)度誤差明顯和變量定義模糊等嚴(yán)重問題。我們認(rèn)為,如果研究者 沒有察覺到這些數(shù)據(jù)缺陷,并且采取有效的方法緩解或消除這些缺陷,那么就會(huì)對(duì)經(jīng)驗(yàn)研究 的結(jié)果產(chǎn)生負(fù)面影響,甚至?xí)?dǎo)致錯(cuò)誤的結(jié)果。而錯(cuò)誤的結(jié)果對(duì)于理論研究和經(jīng)驗(yàn)研究來說, 不僅浪費(fèi)了時(shí)間和精力,而且可能會(huì)產(chǎn)生誤導(dǎo)作用。鑒于此,我們認(rèn)為有必要詳細(xì)地、嚴(yán)謹(jǐn) 地討論中國工業(yè)企業(yè)數(shù)據(jù)庫的基本情況、使用現(xiàn)狀,指出其存在的問題,并盡可能提供解決 問題的建議。我們希望,本文的分析不僅有助于潛在使用者了解該數(shù)據(jù)庫的研究現(xiàn)狀和未來 聶輝華,中國人民大學(xué)經(jīng)濟(jì)學(xué)院,人大企業(yè)與組織研究中心,北京市;email: 。 江艇,中國人民大學(xué)經(jīng)濟(jì)學(xué)院,人大企業(yè)與組織研究中心,;楊汝岱,湘潭大學(xué)消費(fèi) 研究院,。作者感謝何帆對(duì)寫作本文提供的建議,感謝屠順杰提供的助研工作,同時(shí) 感謝兩位匿名審稿人提供的有益建議。本文的研究得到姚洋主持的國家社科基金重大項(xiàng)目“我國中長期經(jīng) 濟(jì)增長與結(jié)構(gòu)變動(dòng)趨勢(shì)研究(09&ZD020)”和聶輝華、楊汝岱分別主持的教育部新世紀(jì)優(yōu)秀人才項(xiàng)目的資 助,特此鳴謝。文責(zé)自負(fù)。 ① 一些英文文章將該數(shù)據(jù)庫名稱翻譯為“China Annual Survey of Industrial Firms”或“China Annual Survey of Manufacturing Firms”。 1 本文發(fā)表于《世界經(jīng)濟(jì)》2023 年第5 期 方向,而且有助于他們更準(zhǔn)確地使用該數(shù)據(jù)庫,從而推進(jìn)相關(guān)領(lǐng)域的研究。當(dāng)然,作為該數(shù) 據(jù)庫的使用者之一,我們并不能保證我們?nèi)娴厥煜ち嗽摂?shù)據(jù)庫,并且我們對(duì)問題的分析不 可避免地包含了一定的研究傾向。 二、數(shù)據(jù)庫基本信息 我們首先簡單地描述數(shù)據(jù)庫的基本情況。中國工業(yè)企業(yè)數(shù)據(jù)庫由國家統(tǒng)計(jì)局建立,它 的數(shù)據(jù)主要來自于樣本企業(yè)提交給當(dāng)?shù)亟y(tǒng)計(jì)局的季報(bào)和年報(bào)匯總。該數(shù)據(jù)庫的全稱為“全部 國有及規(guī)模以上非國有工業(yè)企業(yè)數(shù)據(jù)庫”,其樣本范圍為全部國有工業(yè)企業(yè)以及規(guī)模以上非 國有工業(yè)企業(yè),其統(tǒng)計(jì)單位為企業(yè)法人。這里的“工業(yè)”統(tǒng)計(jì)口徑包括“國民經(jīng)濟(jì)行業(yè)分類” 中的“采掘業(yè)”、“制造業(yè)”以及“電力、燃?xì)饧八纳a(chǎn)和供應(yīng)業(yè)”三個(gè)門類,主要是制造 業(yè)(占 90%以上)。這里的“規(guī)模以上”要求企業(yè)每年的主營業(yè)務(wù)收入(即銷售額)在 500 萬元及其以上,2023 年該標(biāo)準(zhǔn)改為2023 萬元及其以上?;谏鲜鼋y(tǒng)計(jì)口徑的數(shù)據(jù)庫自1998 年開始采集,但多數(shù)學(xué)者使用的工業(yè)企業(yè)數(shù)據(jù)庫涉及的年份在1999-2023 年之間。由于該 數(shù)據(jù)庫的主要成份為制造業(yè)企業(yè),在統(tǒng)計(jì)口徑上與其它國家的產(chǎn)業(yè)分類比較一致,而且一些 變量(例如資本、研發(fā)投入和出貨值)更容易度量,因此使用者通常析出該數(shù)據(jù)庫中的 制造業(yè)企業(yè)。制造業(yè)的統(tǒng)計(jì)口徑包括從農(nóng)副食品加工業(yè)、食品制造業(yè)到工藝品及其它制造業(yè)、 廢棄資源和廢舊材料回收加工業(yè)等30 個(gè)大類(二位數(shù)行業(yè)),對(duì)應(yīng)于國民經(jīng)濟(jì)行業(yè)分類與代 碼(GB/T4754—2023)中的代碼 13-43(沒有 38)。為了保持企業(yè)樣本的完整性,同時(shí)與 現(xiàn)有研究具有可比性,我們以1999-2023 年全部國有及規(guī)模以上非國有工業(yè)企業(yè)作為我們 分析該數(shù)據(jù)庫的主要樣本。 1999-2023 年中國工業(yè)企業(yè)數(shù)據(jù)庫包括了 200 多萬個(gè)觀測(cè)值,每年的樣本企業(yè)數(shù)量從 1999 年的大約16 萬家逐年遞增到2023 年的大約33 萬家。 ① 在9 年樣本期內(nèi),總共有大約 55 萬家企業(yè)出現(xiàn),包括上市公司。顯然,這是一個(gè)巨大的非平衡面板數(shù)據(jù)。由于企業(yè)關(guān)閉、 改制、重組等各種原因,只有4 萬6 千多家企業(yè)(約占樣本企業(yè)總數(shù)的8%)連續(xù)出現(xiàn)在整 個(gè)樣本期間。該數(shù)據(jù)庫樣本占據(jù)了中國工業(yè)企業(yè)的絕大部分比例。根據(jù)具有可比性的 2023 年之一次全國經(jīng)濟(jì)普查年報(bào),當(dāng)年工業(yè)企業(yè)銷售額為218442.81 億元。而中國工業(yè)企業(yè)數(shù)據(jù) 庫當(dāng)年全部樣本企業(yè)的銷售額為億元,約占全國的89.5%。 ② 目前,除了經(jīng)濟(jì)普查 數(shù)據(jù)庫,中國工業(yè)企業(yè)數(shù)據(jù)庫是可獲得的更大的企業(yè)級(jí)數(shù)據(jù)庫。表1 描述了1999-2023 年 企業(yè)總數(shù)和國有、集體、民營、外資企業(yè)(含港澳臺(tái)企業(yè))的份額變化??梢钥闯觯瑖泻?集體企業(yè)的比例在顯著減少,從1999 年的三分之二下降到2023 年的不足十分之一,而民營 企業(yè)的比例從不足 20%迅速增加到超過 70%。該表從一個(gè)側(cè)面反映了中國市場經(jīng)濟(jì)結(jié)構(gòu)的 劇烈變動(dòng)。 表1 中國工業(yè)企業(yè)的類型、數(shù)目和比例 年份 國有 比例% 集體 比例% 民營 比例% 外資 比例% 總數(shù)………………..① 學(xué)者們使用的該數(shù)據(jù)庫可能有幾個(gè)不同的來源,但是內(nèi)容相差很小。 ② 經(jīng)濟(jì)普查的工業(yè)企業(yè)銷售額來自國家統(tǒng)計(jì)局網(wǎng)站《之一次全國經(jīng)濟(jì)普查主要數(shù)據(jù)公報(bào)(第二號(hào))》,工業(yè) 企業(yè)數(shù)據(jù)庫中的工業(yè)企業(yè)銷售額來自作者計(jì)算。 2 本文發(fā)表于《世界經(jīng)濟(jì)》2023 年第5 期…………….來源:作者根據(jù)數(shù)據(jù)庫計(jì)算 事實(shí)上,工業(yè)企業(yè)數(shù)據(jù)庫也是最全面的企業(yè)數(shù)據(jù)庫。該數(shù)據(jù)庫包括企業(yè)的兩類信息, 一類是企業(yè)的基本情況,另一類是企業(yè)的財(cái)務(wù)數(shù)據(jù)。企業(yè)的基本情況包括:法人代碼、企業(yè) 名稱、法人代表、聯(lián)系、郵政編碼、具體地址、所屬行業(yè)、注冊(cè)類型(所有制)、隸屬 關(guān)系、開業(yè)年份和職工人數(shù)等指標(biāo)。企業(yè)的財(cái)務(wù)數(shù)據(jù)包括:流動(dòng)資產(chǎn)、應(yīng)收賬款、長期投資、 固定資產(chǎn)、累計(jì)折舊、無形資產(chǎn)、流動(dòng)負(fù)債、長期負(fù)債、實(shí)收資本、主營業(yè)務(wù)收入、主營業(yè) 務(wù)成本、營業(yè)費(fèi)用、管理費(fèi)用、財(cái)務(wù)費(fèi)用、營業(yè)利潤、利稅總額、廣告費(fèi)、研究開發(fā)費(fèi)、工 資總額、福利費(fèi)總額、增值稅、工業(yè)中間投入、工業(yè)總產(chǎn)值和出貨值等指標(biāo)。全部指標(biāo) 大約為 130 個(gè)。特別是,2023 年為之一次全國經(jīng)濟(jì)普查年,因此在數(shù)據(jù)庫中當(dāng)年的企業(yè)指 標(biāo)還包括了不同學(xué)歷(研究生、本科、大專、中專、高中、初中及以下)、不同職稱(技術(shù) 職稱和技師等)的男職工和女職工的相應(yīng)數(shù)量,此外還包括了企業(yè)是否加入工會(huì)以及加入工 會(huì)的人數(shù)等其它年份所沒有的信息。 毋庸置疑,工業(yè)企業(yè)數(shù)據(jù)庫的優(yōu)勢(shì)非常顯著。之一,它的樣本量非常大,涵蓋了全國 所有的國有工業(yè)企業(yè)和規(guī)模以上的非國有工業(yè)企業(yè)。9 年的觀測(cè)值總數(shù)超過200 萬個(gè)。2023 年之后,每年的樣本企業(yè)數(shù)目已經(jīng)超過了30 萬個(gè)。除了普查數(shù)據(jù)庫,還沒有哪個(gè)企業(yè)數(shù)據(jù) 庫在樣本量上能與之匹敵。從統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)的角度講,大樣本的優(yōu)勢(shì)是降低估計(jì)的近 似偏誤,提高估計(jì)的效率。第二,它的指標(biāo)非常多,包括了企業(yè)的基本情況和企業(yè)的財(cái)務(wù)數(shù) 據(jù),能夠從多個(gè)角度比較全面地反映企業(yè)的市場進(jìn)入、投資、借貸、廣告、研發(fā)、出口等行 為和企業(yè)的短期與長期經(jīng)營績效,并且企業(yè)加總數(shù)據(jù)能夠反映出企業(yè)所處行業(yè)或地區(qū)的市場 結(jié)構(gòu)。從產(chǎn)業(yè)組織理論的角度講,一旦可以獲得市場結(jié)構(gòu)、企業(yè)行為和績效的數(shù)據(jù),學(xué)者們 幾乎就可以進(jìn)行任何主題的研究!公司金融、企業(yè)理論、國際貿(mào)易和產(chǎn)業(yè)集聚等相關(guān)領(lǐng)域的 研究者們也可以對(duì)該數(shù)據(jù)庫各取所需,包括進(jìn)行跨專業(yè)研究。如果將該數(shù)據(jù)庫和其它數(shù)據(jù)庫 合并,那么學(xué)者們將會(huì)發(fā)現(xiàn)更加豐富的研究視角。指標(biāo)越多,在構(gòu)建計(jì)量方程時(shí)解釋變量和 控制變量就越多,這樣可以減少遺漏變量問題。第三,它的時(shí)間序列比較長。工業(yè)企業(yè)數(shù)據(jù) 庫最早的建立年份是1998 年,目前已經(jīng)更新到了2023 年,前后跨期11 年。這使得研究者 采用動(dòng)態(tài)面板方法具有可行性,從而有助于反映歷史因素的作用,以及從動(dòng)態(tài)的角度研究企 業(yè)和產(chǎn)業(yè)的演化過程。 相對(duì)而言,目前流行的其它幾個(gè)企業(yè)數(shù)據(jù)庫,例如萬得金融數(shù)據(jù)庫、色諾芬經(jīng)濟(jì)金融 數(shù)據(jù)庫、國泰安上市公司數(shù)據(jù)庫,樣本企業(yè)都是上市公司,它們的指標(biāo)更全面、準(zhǔn)確,提供 指標(biāo)的頻率也更高。比如,這些上市公司數(shù)據(jù)庫通常包括了主要股東持股情況、董事會(huì)成員 和高管的個(gè)人特征以及職位變動(dòng),從而可以研究公司治理結(jié)構(gòu)。另外,上市公司數(shù)據(jù)庫不僅 包含工業(yè)類上市公司,還包含了金融類和服務(wù)類上市公司,這也是工業(yè)企業(yè)數(shù)據(jù)庫所缺乏的。 此外,一些特定的調(diào)查項(xiàng)目也催生了企業(yè)數(shù)據(jù)庫。例如,2023 年世界銀行和國家統(tǒng)計(jì)局對(duì) 中國12 省的1200 多家企業(yè)進(jìn)行了調(diào)查,內(nèi)容涉及企業(yè)社會(huì)責(zé)任、內(nèi)部管理、質(zhì)量管理、勞 動(dòng)管理、環(huán)境管理、市場競爭以及技術(shù)改造等方面。從1991 年到2023 年,中央統(tǒng)戰(zhàn)部和全 國工商聯(lián)陸續(xù)對(duì)全國民營企業(yè)的經(jīng)營情況進(jìn)行了抽樣調(diào)查,內(nèi)容涉及企業(yè)基本情況、管理體 制、企業(yè)家背景以及勞資關(guān)系等方面。 ① ① 關(guān)于其它企業(yè)數(shù)據(jù)庫,感興趣的讀者可以訪問香港中文大學(xué)中國研究服務(wù)中心的網(wǎng)站。 3 本文發(fā)表于《世界經(jīng)濟(jì)》2023 年第5 期 三、數(shù)據(jù)庫使用現(xiàn)狀 由于工業(yè)企業(yè)數(shù)據(jù)庫的獨(dú)特優(yōu)勢(shì),近幾年來每年都有大量的海內(nèi)外經(jīng)濟(jì)學(xué)者使用該數(shù) 據(jù)庫撰寫和發(fā)表論文,主題涵蓋產(chǎn)業(yè)組織理論、企業(yè)理論、公司金融、轉(zhuǎn)型經(jīng)濟(jì)學(xué)、國際貿(mào) 易、勞動(dòng)經(jīng)濟(jì)學(xué)和區(qū)域經(jīng)濟(jì)學(xué)等學(xué)科。下面,我們簡要介紹工業(yè)企業(yè)數(shù)據(jù)庫在上述經(jīng)濟(jì)學(xué)分 支中的使用現(xiàn)狀。一方面,我們希望這有助于感興趣的研究人員了解人們?cè)诓煌I(lǐng)域已經(jīng)用 該數(shù)據(jù)庫做了什么,還可以做什么;另一方面,我們希望這有助于感興趣者了解現(xiàn)有研究者 是如何做這些研究的。當(dāng)然,囿于篇幅和精力,我們不可能囊括所有使用該數(shù)據(jù)庫的文獻(xiàn), 而是將目光聚焦于國內(nèi)外的主要學(xué)術(shù)期刊或者流傳較廣的英文文章。 1、生產(chǎn)率 在所有使用該數(shù)據(jù)庫的相關(guān)研究文獻(xiàn)中,企業(yè)生產(chǎn)率是最受關(guān)注的主題。因?yàn)樯a(chǎn)率 是最重要的效率度量,正如克魯格曼(Krugman,1997)所言:“生產(chǎn)率不是一切,但是長 期來看生產(chǎn)率近似于一切。”而且,對(duì)于計(jì)算企業(yè)生產(chǎn)率而言,工業(yè)企業(yè)數(shù)據(jù)庫提供了加總 數(shù)據(jù)所不具有的獨(dú)特優(yōu)勢(shì)。利用工業(yè)企業(yè)數(shù)據(jù)庫中提供的銷售額或經(jīng)濟(jì)增加值(表示Y)、 固定資產(chǎn)(表示K)和職工人數(shù)(表示L),采取相應(yīng)的價(jià)格指數(shù)進(jìn)行平減,可以計(jì)算出每個(gè) 企業(yè)的勞動(dòng)生產(chǎn)率和全要素生產(chǎn)率(total factors productivity,簡稱TFP)。鑒于勞動(dòng)生產(chǎn)率 不能反映資本的效率,因此多數(shù)文獻(xiàn)以TFP作為生產(chǎn)率的度量。又因?yàn)橹圃鞓I(yè)口徑與國際產(chǎn) 業(yè)分類更具可比性,所以現(xiàn)有文獻(xiàn)在計(jì)算TFP時(shí)幾乎都以制造業(yè)企業(yè)為樣本。在計(jì)算TFP時(shí), 一些學(xué)者采取了傳統(tǒng)的索洛殘差法(Solow residual),例如謝千里等(2023)、Hsieh和Klenow (2023);一些學(xué)者采取了主流的OP方法(Olley和Pakes,1996),例如張杰等(2023)、余 淼杰(2023)、聶輝華和賈瑞雪(2023)、楊汝岱和熊瑞祥(2023)、Brandt等(2023);一些 學(xué)者采取了LP方法(Levinsohn和Petrin,2023),例如周黎安等(2023);一些學(xué)者采取了隨 機(jī)邊界方法(SFA),例如劉小玄和李雙杰(2023)。 ① 2、國際貿(mào)易 與生產(chǎn)率研究密切相關(guān)的是國際貿(mào)易,更具體地說,是考察企業(yè)出口與生產(chǎn)率的關(guān)系。 根據(jù)著名的企業(yè)異質(zhì)性假說(Melitz,2023),生產(chǎn)率高的企業(yè)會(huì)傾向于選擇出口,即生產(chǎn) 率和出口是正相關(guān)的。工業(yè)企業(yè)數(shù)據(jù)庫包含了企業(yè)出貨值,但無法區(qū)分一般貿(mào)易和加工 貿(mào)易企業(yè)。利用工業(yè)企業(yè)數(shù)據(jù)庫,一些學(xué)者檢驗(yàn)了這一假說對(duì)于中國企業(yè)是否成立。張杰等 (2023)利用1999-2023 年的制造業(yè)企業(yè)數(shù)據(jù)發(fā)現(xiàn),出口有利于企業(yè)提高TFP,即存在出 口的“學(xué)習(xí)效應(yīng)”。而李春頂(2023)利用1998-2023 年的樣本發(fā)現(xiàn),出口企業(yè)的平均TFP 或勞動(dòng)生產(chǎn)率低于內(nèi)銷企業(yè),他認(rèn)為這是“生產(chǎn)率悖論”。此外,趙偉等(2023)發(fā)現(xiàn)勞動(dòng) 生產(chǎn)率與出口選擇是負(fù)相關(guān)的,但 TFP 有時(shí)與出口選擇是正相關(guān)的。這似乎表明,利用該 數(shù)據(jù)庫文獻(xiàn)研究還沒有明確地支持企業(yè)異質(zhì)性假說,但 Lu(2023)對(duì)此提供了一個(gè)理論解 釋。還有一些學(xué)者利用工業(yè)企業(yè)數(shù)據(jù)庫做了相關(guān)的研究。例如,余淼杰(2023)發(fā)現(xiàn),貿(mào)易 自由化(降低關(guān)稅)會(huì)提高出口企業(yè)的TFP;包群等(2023)發(fā)現(xiàn),制造業(yè)企業(yè)出口后對(duì)其 員工收入的改善并不明顯;楊汝岱和鄭辛迎(2023)發(fā)現(xiàn)行業(yè)的垂直專業(yè)化程度對(duì)企業(yè)員工 工資有差異化影響。 3、外商直接投資 中國加入 WTO 已經(jīng)十周年了,外商直接投資(FDI)究竟在中國的經(jīng)濟(jì)發(fā)展中扮演了 什么樣的角色?亓朋等(2023)利用1998-2023 年的制造業(yè)企業(yè)數(shù)據(jù),考察了外資企業(yè)對(duì) 內(nèi)資企業(yè) TFP 的溢出效應(yīng),發(fā)現(xiàn)在行業(yè)內(nèi)溢出效應(yīng)不顯著,行業(yè)間和地區(qū)間均存在正的溢 出效應(yīng)。羅雨澤等(2023)使用2023 年和2023 年的制造業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)外商投資企業(yè)對(duì) ① 聶輝華和賈瑞雪(2023)比較了計(jì)算TFP 的幾種方法的優(yōu)劣。 4 本文發(fā)表于《世界經(jīng)濟(jì)》2023 年第5 期 本行業(yè)和本地區(qū)的內(nèi)資企業(yè)有顯著正的溢出效應(yīng)。有趣的是,路江涌(2023)利用 1998- 2023 年的制造業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)外資企業(yè)對(duì)內(nèi)資企業(yè)的溢出效應(yīng)隨地理距離而遞減,在本 市內(nèi)溢出效應(yīng)為正,在全國范圍內(nèi)為負(fù),并且對(duì)國企為負(fù),對(duì)民企為正。Du 等(2023)發(fā) 現(xiàn),外資企業(yè)對(duì)內(nèi)資企業(yè)的溢出效應(yīng)主要是通過前向或后向產(chǎn)業(yè)關(guān)聯(lián)實(shí)現(xiàn)的,橫向產(chǎn)業(yè)關(guān)聯(lián) 沒有產(chǎn)生顯著的溢出效應(yīng);而且,來自港澳臺(tái)的外資企業(yè)和來自外國的外資企業(yè)對(duì)內(nèi)資企業(yè) 的影響也不相同。Xu 和Sheng(2023)也得到了類似的發(fā)現(xiàn)。Sheng 等(2023)還發(fā)現(xiàn),F(xiàn)DI 通過后向產(chǎn)業(yè)關(guān)聯(lián)提高了內(nèi)資企業(yè)的出口價(jià)值,通過同行業(yè)的示范效應(yīng)提高了內(nèi)資企業(yè)的出 口傾向。Chen 等(2023)發(fā)現(xiàn),外資企業(yè)具有明顯的工資溢價(jià),并且對(duì)內(nèi)資企業(yè)的工資有 抑制作用,從而加劇了企業(yè)之間的工資不平等現(xiàn)象。 4、研發(fā) 技術(shù)創(chuàng)新是企業(yè)生產(chǎn)率的重要源泉之一,因此企業(yè)的研究開發(fā)(R&D)行為也備受關(guān) 注。關(guān)于 R&D 的文獻(xiàn)主要分為兩類:之一類是研究 R&D 或者企業(yè)創(chuàng)新的決定因素,主要 是檢驗(yàn)“熊彼特假說”;第二類是研究企業(yè)的 R&D 對(duì)績效的影響。聶輝華等(2023)利用 2023-2023 年的制造業(yè)企業(yè)數(shù)據(jù),分析了發(fā)現(xiàn)企業(yè)的研發(fā)密度(度量創(chuàng)新)與規(guī)模、市場 競爭之間均呈倒 U 型關(guān)系,而且盡管國有企業(yè)的研發(fā)密度比民營企業(yè)的更高,但是研發(fā)的 效率更低。Hu 等(2023)發(fā)現(xiàn)FDI 和企業(yè)改制對(duì)于促進(jìn)企業(yè)研發(fā)密度有正面作用。陳林和 朱衛(wèi)(2023)使用2023-2023 年的工業(yè)企業(yè)數(shù)據(jù),根據(jù)國有經(jīng)濟(jì)比重區(qū)分行政進(jìn)入壁壘高 的行業(yè)和行政進(jìn)入壁壘低的行業(yè),發(fā)現(xiàn)在前一類行業(yè)中創(chuàng)新與市場結(jié)構(gòu)之間是倒U 型關(guān)系, “熊彼特假說”成立,但是在后一類行業(yè)中相反。Cherough 和Liang(2023)以制造業(yè)中 的半導(dǎo)體行業(yè)為例,發(fā)現(xiàn)市場導(dǎo)向會(huì)影響企業(yè)R&D 的投資回報(bào),即全球市場導(dǎo)向的企業(yè)比 國內(nèi)市場導(dǎo)向的企業(yè)能夠獲得更高的 R&D 回報(bào)。戴覓和余淼杰(2023)發(fā)現(xiàn),出口前的 R&D 投資能夠促進(jìn)企業(yè)在出口后的生產(chǎn)率提高。 5、民營化 中國國有企業(yè)改革的主要成效之一,就是大量的國有企業(yè)進(jìn)行了轉(zhuǎn)制,即從百分之百 的國有企業(yè)變成了國有控股企業(yè)或者民營企業(yè)。這一點(diǎn)明顯地反映在國有工業(yè)企業(yè)的實(shí)收資 本成份變化上。Tong(2023)利用1998-2023 年的工業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)市場競爭的加劇、 FDI 集中度的上升以及預(yù)算約束的硬化是國企民營化的主要?jiǎng)右颍铱冃鄬?duì)好的國企更 有可能民營化。Bai 等(2023)研究了國企民營化的影響,發(fā)現(xiàn)民營化增加了銷售額和勞動(dòng) 生產(chǎn)率,而這主要是通過減少管理費(fèi)用來實(shí)現(xiàn)的。Dougherty 等(2023)發(fā)現(xiàn),民營化通過 提高企業(yè)的贏利能力和生產(chǎn)的地區(qū)專業(yè)化水平提高了企業(yè)的生產(chǎn)率。Lu 等(2023)發(fā)現(xiàn), 集體企業(yè)的私有化導(dǎo)致了銷售成本的上升,但是也導(dǎo)致了管理費(fèi)用的下降。 6、公司金融 由于中國工業(yè)企業(yè)數(shù)據(jù)庫包含了豐富的財(cái)務(wù)指標(biāo),因此很多學(xué)者用它研究企業(yè)的投資、 融資和避稅行為。Cai 和 Liu(2023)提出了一個(gè)有趣的問題:競爭是否會(huì)加劇公司規(guī)避所 得稅?他們識(shí)別避稅程度的方式是,比較企業(yè)報(bào)告的利潤和根據(jù)會(huì)計(jì)規(guī)則計(jì)算的利潤之間的 差額。使用 2023-2023 的工業(yè)企業(yè)數(shù)據(jù),他們發(fā)現(xiàn)競爭會(huì)加劇企業(yè)的避稅行為。Cull 等 (2023)認(rèn)為,中國的銀行貸款(loan)和商業(yè)信用(trade credit)之間存在一種替代關(guān)系, 業(yè)績差的國企會(huì)通過商業(yè)信用將銀行貸款再配置給企業(yè)客戶,而業(yè)績好的民營企業(yè)比業(yè)績差 的民營企業(yè)更有可能擴(kuò)展商業(yè)信用。余明桂和潘紅波(2023)利用2023-2023 年的工業(yè)企 業(yè)數(shù)據(jù)發(fā)現(xiàn),企業(yè)(特別是私有企業(yè))會(huì)將授予客戶的商業(yè)信用作為產(chǎn)品市場競爭的手段, 這驗(yàn)證了商業(yè)信用的競爭假說。Guariglia 等(2023)發(fā)現(xiàn),民營企業(yè)的內(nèi)部融資(現(xiàn)金流/ 總資產(chǎn))是企業(yè)增長的重要約束條件,而國有企業(yè)則不受此類約束。 7、產(chǎn)業(yè)集聚 利用企業(yè)層面的數(shù)據(jù),我們可以得到行業(yè)或地區(qū)層面的加總數(shù)據(jù),這可以反映中國工業(yè) 5 本文發(fā)表于《世界經(jīng)濟(jì)》2023 年第5 期 的產(chǎn)業(yè)集聚現(xiàn)象。使用1998-2023 年的制造業(yè)企業(yè)數(shù)據(jù),Lu 和Tao(2023)考察了中國制 造業(yè)集聚(用EG 指數(shù)衡量)的決定因素,發(fā)現(xiàn)地方保護(hù)主義(國有企業(yè)的雇傭比例)是阻 礙產(chǎn)業(yè)地區(qū)集聚的主要因素。另外一些學(xué)者考察了產(chǎn)業(yè)集聚對(duì)企業(yè)的影響。Li 等(2023) 發(fā)現(xiàn)產(chǎn)業(yè)集聚對(duì)企業(yè)規(guī)模有顯著的正面影響。Lin 等(2023)發(fā)現(xiàn),產(chǎn)業(yè)集聚和企業(yè)生產(chǎn)率 之間存在一種倒U 型關(guān)系。Yang 和He(2023)發(fā)現(xiàn)貿(mào)易通過信息和分工影 轉(zhuǎn)載僅供參考,版權(quán)屬于原作者。祝你愉快,滿意請(qǐng)采納哦
要將工業(yè)企業(yè)數(shù)據(jù)庫轉(zhuǎn)換為面板數(shù)據(jù),您需要執(zhí)行以下步驟:1. 對(duì)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)清理和預(yù)處理,以確保數(shù)據(jù)質(zhì)量和一致性。2. 根據(jù)您所需的面板數(shù)據(jù)類型和指標(biāo),選擇合適的數(shù)據(jù)表,并將其轉(zhuǎn)換為透視表或交叉表。3. 在透視表或交叉表中添加行、列、過濾器和數(shù)值字段以輸出所需的面板數(shù)據(jù)。4. 更改數(shù)據(jù)的呈現(xiàn)方式,例如將數(shù)據(jù)透視為圖表或圖形,以使數(shù)據(jù)更易于理解和分析。5. 將面板數(shù)據(jù)導(dǎo)出為Excel、CSV或其他數(shù)據(jù)格式,以便在其他應(yīng)用程序中使用和共享。6. 定期更新數(shù)據(jù)和面板,以反映新的業(yè)務(wù)和市場趨勢(shì)。
關(guān)于行人識(shí)別數(shù)據(jù)庫 正負(fù)樣本的介紹到此就結(jié)束了,不知道你從中找到你需要的信息了嗎 ?如果你還想了解更多這方面的信息,記得收藏關(guān)注本站。
創(chuàng)新互聯(lián)服務(wù)器托管擁有成都T3+級(jí)標(biāo)準(zhǔn)機(jī)房資源,具備完善的安防設(shè)施、三線及BGP網(wǎng)絡(luò)接入帶寬達(dá)10T,機(jī)柜接入千兆交換機(jī),能夠有效保證服務(wù)器托管業(yè)務(wù)安全、可靠、穩(wěn)定、高效運(yùn)行;創(chuàng)新互聯(lián)專注于成都服務(wù)器托管租用十余年,得到成都等地區(qū)行業(yè)客戶的一致認(rèn)可。
標(biāo)題名稱:行人識(shí)別數(shù)據(jù)庫:如何構(gòu)建正負(fù)樣本?(行人識(shí)別數(shù)據(jù)庫正負(fù)樣本)
鏈接URL:http://www.dlmjj.cn/article/ccoddhp.html


咨詢
建站咨詢
