分类:广义投入产出分析

来自Big Physics


在经济学Leontief投入产出分析和Google PageRank算法的基础上,我们提出来了广义投入产出分析(暂时见这个在“吴金闪的工作和思考”博客站点上的帖子)。

Leontief投入产出分析

原始的投入产出分析[1] 是用于分析经济产品或者经济部门或者说产业——由于数据获取的限制,部门或者说产业更经常被研究的主体,尽管思想上这个方法也可以用于产品的研究——之间的相互影响的。

部门(产业)层次的投入产出表

把整个经济分成个部门,假设每一个部门仅仅生产一种产品,每一个部门可以从任何一个部门获得生产这个产品的原材料和劳动力。进出口实际上也可以看做是一个单独的部门。在这里,我们暂时忽略进出口。这样整个经济在一段时期内的经济生产关系就可以用以下的矩阵来代表, 其中代表部门对部门的投入的产品的数量(实物投入产出表)或者价值(货币投入产出表)。全球投入产出表,并且包含环境的数据,可以从这里获得进一步信息[2]

产品生产(化学反应)层次的投入产出表

假设有了产品层次的这张表,如果确实一个生产工艺仅仅产出一个产品,那么,所有的经济生产就包含在这个矩阵内了。当然,随着科学技术的进步,新的产品和新的生产工艺还会出现,因此,这张表仅仅是某个比较短的时期内的一张表,甚至原则上是某个时间点的一张表。当然,实际上,每一个生产工艺有可能有多个产出,因此,整体来说,产品生产就像化学反应,只不过可能场地、劳动力、生产设备、能源等等需要和原材料以及产出物一起放到这个投入产出表里面。对于这样的整个经济的生产工艺,实际上,需要另两个张量来描述,例如表示工艺需要产品的数量或者价值,表示工艺产出的产品的数量或者价值。也可以把两个张量合起来,用表示,用在数字前面增加一个“”(正号)或者“”(负号)来标记生产和需求。

这三个矩阵也可以看作是产品-工艺(或者反应物-反应方程)二分网的加权邻接矩阵。

典型研究问题

那么,有了这个完整的生产关系的描述之后,投入产出分析主要解决什么样的问题呢?第一个,当工艺水平不变的时候,如果人们对于某个产品的需求增加了,则,经济生产系统讲产生怎样的响应?

把第个部门看作是最终消费者部门,把这个问题用数学的语言来说,就是,有可能有一个可以预期的变化(或者更一般的任意一个部门的变化,记为),例如下一年人们需要更多的汽车,则矩阵的其他元素将如何变化。记这个变化为。我们希望得到一个 和 之间的关系。

先从理念上来解决这个问题,再从数学上来解决。

为了有更多的汽车来满足最终消费者需求,经济生产体系首先要满足制造出来这么多额外的汽车的要求;接着为了生产这些汽车,经济生产体系需要生产这些汽车的原材料;接着,需要生产出来原材料的原材料;等等等等。在数学上,这就是

其中就是某个代表从产品计算出来原材料的矩阵。下面,我们来看这个实际上可以如何定义。

定义,其中表示部门的总产出。因此,表示没=每生产一个产品所需要的产品的数量或者价值。于是,这个看起来像一个生产工艺配方。这样的配方可以看做在一定时期内是不变的,或者其变化远远比产品的生产要慢。自然,这就是我们想要找到的矩阵

从数学上,我们也可以推导出来,,写成矩阵的形式也就是。现在我们把分成并且扔掉后者,我们得到,写成矩阵的形式就是,也就是

定义,称为Leontief矩阵,我们就得到了。由于这是一个线性关系,于是,这就是回答了我们一开始的问题:如果有一个最终需求上的可预期的波动,那么经济生产系统将如何响应。

有了这个典型问题的答案,我们就可以讨论各种进一步的问题,尤其是弹性和乘数。在那之前,我们来讨论几个理解上要注意的细节。

注意总产出的定义

它计算的是部门的总产出,是把到所有的各部门的投入都计算进去的,而不是仅仅计算对前面的个部门的投入,也就是,

为什么把最终消费者部门分出来

在展开进一步讨论之前,我们稍微来说一下,为什么需要把最终消费者部门独立出来。首先,在经济生产中,最终消费者部门的再生产(也就是劳动力本身的再生产)的时间尺度比较长,确实可以和其他生产分开。其次,劳动力的价值本身是一个难以度量的量,不是可以简单看做工人工资的。把部门独立出来之后,也不再需要直接出现在矩阵里面了,因此的每一个元素都能够很好地定义了。顺便,这个是劳动力对于产业的投入,被称为value-added。但是,其实,在一个总量守恒的系统里面,当我们已知所有的其他元素的时候,是可以算出来的。因此,第二个理由实际上不算理由。再次,也就是最重要的理由,经济学家相信,能够主动产生一个波动的,只能来自于最终消费者。其他的生产部门一旦技术矩阵定了以后,就不会主动去产生波动了,而是被动地由于需求导致的波动。

可是,再仔细想一下,实际上,某些资源,例如石油有可能会产生独立的波动,并且这个波动还可能由于某些原因,仅仅直接影响对某几个部门的投入,也就是需要考虑对产业的效果。于是,我们就需要对Leontief的投入产出分析做一些推广。关于这个推广,我们在目标外界投入产出分析再来讨论。

乘数和弹性

如果我们要考虑上的小小的扰动(例如一个单位)对经济体系的响应的效果,则我们可以先计算出来这个扰动导致的,接着把这些被扰动以后的乘以某一个权重加起来。例如,权重都是1的时候,我们得到,。这就叫做乘数效益:一个单位最终消费对于i产品的增加,将如何改变整个经济体系。

产业重要性

投入产出分析还可以用来衡量领域的重要性。一定程度上,前面的乘数和弹性就是一种重要性衡量。另外一种产业重要性的衡量方式是Hypothetical Extraction Method(HEM,假想地去掉某个领域的方法)。

同时做实物和货币投入产出分析

如果我们能够同时拿到实物形式和货币形式的两张投入产出表,我们能够做什么?这个问题我还没有想清楚,是不是和PageRank算法有关系,是不是能够一定程度上给一个产品内在价格以及价格动力学的描述?关于这个问题,Leontief和[1] 有深刻的讨论,还需要再去看一遍。

目标外界投入产出分析

这个想法非常简单,既然前面我们把最终消费者部门独立出来,放到方程的右边,那么,我们能不能把一般的部门拿出来放到方程的右边呢?对于通过守恒量补齐了value-added数据的投入产出表,或者说本来就是所有元素的值都有的投入产出表来说,这一点,技术上是能做到的。好,那道理上,能不能做,有没有意义?我们说,把最终消费者部门独立出来是因为我们认为它们能够产生独立的可预期的偏离,那么,是不是其他部门也能够产生独立的可预期的偏离呢?例如,石油输出组织决定以后就是不给做塑料袋的工厂提供原材料?这是有可能的。于是,我们就应该提出来一个把任意一个希望得到研究的产业独立出来放到外面去的研究方法。这相当于讨论了那个被移出来的部门N如果增加一个对某个部门j的需求之后,整个系统将产生的响应。沿着这个思路,实际上,我们还可以讨论如果把两个或者多个部门移到系统外面,并且产生一个需求的改变之后,系统的响应的问题,甚至对比这个响应和两个部门各自移出来产生的响应的问题。因此,目标外界投入产出是一个很有用的分析技术。这样对于封闭系统的研究,我们就有了成体系的方法,没准也能够用来度量那些个移出来的部门的重要性(影响力)。

至于具体的计算,完全和开放系统的投入产出一样,仅仅把右边的矢量从最终消费者部门替换成特定想要研究的部门。至于有了这个部门讨论哪些经济学问题,后续具体研究工作中再展开讨论。

封闭系统的投入产出分析

这个问题来自于这样的情景:如果系统完全没有一个可以独立出来放到右边的部门,或者我们不想把这样的东西拿出来放到右边,我们是不是还能够讨论这样的部门的重要性,同时考虑直接和间接重要性。那怎么分析?例如,当这个体系中的某个部门的生产力降低了以后,或者出现了扰动以后,所有经过这个部门加工的产品都会出现一些问题,然后进入其他部门,接着再一次回到这个部门(因为整体上是封闭的系统)之后还会再一次受影响。这样的影响如何衡量?

我们提出来一些可以尝试的分析方法,本身不一定就是最好的分析方法,但是这个问题还是要回答的。

我们自己的方法具体来说,就是本征矢量HEM。

把PageRank算法看做广义投入产出分析

定义,表示的总产出当中,百分之多少进入了部门。类似也可以定义,表示收到的所有投入中,百分之多少来自于部门。这两个分别称为向前和向后概率转移矩阵。

PageRank算法[3]理论上可以看作是上面定义的概率转移矩阵的本征向量,也就是,其中的最大右本征值(1是本征值,并且是最大的本征值,这一点非常容易证明。例如通过证明最大左本征值是平庸的)。类似地,是的最大左本征值(同样最大右本征值是平庸的)。

不过最大本征矢量的计算需要保证矩阵的最大本征值是非简併的,并且考虑到外界输入的问题——例如人们访问网页的时候有的时候追着超链接,有的时候会重新开始,有的时候总是从某些熟悉的网页开始——实际上PageRank算法计算的是如下的线性方程的解。当然,也是考虑到求线性方程的解可以更加算法效率更高的问题。 。其中代表随机重新开始浏览网页,或者某个代表用户特定使用习惯的。前者就是目前通用的PageRank矢量,后者被称为个性化PageRank矢量。


有了这个概率转移矩阵,我们可以来看这个转移矩阵的稳定态,也就是其本征矢量。为了保证本征矢量的唯一性,有的时候需要加上一个很小的微扰项。将来我们还会发现,这个微扰项还可以当做外界来解释。于是,我们看到,在PageRank上,封闭系统的形式、(随机)开放系统的形式、目标外界开放系统的形式,得到了统一。

实际上PageRank的目标外界、开放系统形式可以单独做一些研究,例如维持某个网站(部门)对其他部门的投入组合方式(或者需求组合方式)基本不变仅仅产生一个小小的改变的时候,其他各个网站(部门)的PageRank值或者某个总量会如何响应,例如把专利引用论文当作外界,传递到引文网络中去,看文章的影响力,例如把概念的使用频率当作外界,传递到概念网络中去,来看概念的影响力和学习顺序。

顺便,我们这里证明一个投入产出矩阵的本征向量和PageRank矩阵的本征向量的一一对应关系,从而更加深刻地说明,两个分析方法实际上是一样的,仅仅是计算出来的量的解释或者说具体意义上略有区别。

于是,的左本征向量,正好对应着的左本征向量。同样于是,的右本征向量,正好对应着的右本征向量

问:这个本征向量在经济学上,到底什么意义?可以不管如何先在实际系统上算出来看看,对比一下这个本征向量和其他已有指标

顺便,这个来源于网页排名的PageRank已经被用来给文章、期刊等排名,基于文章或者期刊的引用网络[4][5][6]。 其它考虑间接引用的评价算法可参见[7]

向前(投入端)和向后(需求端)分析

定义,表示平均每收到一个的其他部门的投入的时候,将会对部门做出来多少投入。在这个意义上,我们把这个投入产出关系矩阵叫做向前分析(Forward)——产出关系。之前那个没生产一个产品需要多少个看做向后(Backward)——需求关系。

注意,在实物投入产出分析中,是不能加起来的——来自于不同产业的产品数量不能简单相加。因此,这个分析只能够在货币或者能量等意义下来做。

有了这个定义之后,同样,可以推导出来,,其中,也就是最终消费者部门对部门的劳动力投入或者说价值附加(value-added)投入。按照[1]的理解,也可以看做是投入到某个部门的劳动力价格的变化。因此,后续的就表示这个劳动力价格变化在整个生产部门传播的效果。

为了表示两个矩阵的区别,有的时候,我们采用Einstein记号写作,

  • ,向后投入产出分析
  • ,向前投入产出分析

在向前和向后分析中,我们回答的典型问题有:给定消费者需求预期的整体经济响应,消费者对某个产品的需求的乘数效益,或者投入到某个部门的劳动力价格的变化的乘数效益,领域部门的重要性,产品或者能源税收造成的经济的响应,包含初级原材料、污染物、能源等环境因素的投入产出分析用来回答环境和生产互动。

产品-技术二分网或者双层网上的投入产出分析

同样的思想甚至技术用来讨论二分网或者双层网。当然,首先,可以直接把二分网和双层网当做一个大网络来用,也可以考虑更加一般的分析方法:例如从生产企业到产品,这样的网络。具体怎么做,还得继续研究。在科学计量学三层网络框架里面,这样的分析方法是非常重要的。

组合溢出效益

前面我们讨论了通过去掉某个部门对整体系统的影响,用同样的思路,我们可以讨论去掉两个或者几个部门,或者几个矩阵元素的影响,并且把这个影响和单独去掉这些部门的影响相比较,来看看是不是有组合溢出效益。例如在[流平衡分析(Flux Balance Analysis)]中,我们可以看到两个基因的组合溢出效益——合起来的效果不等于两个分开效果的叠加,见下图[8]。先计算在去掉单个基因的影响,然后计算去掉任意一对合起来的影响,接着对比这个影响。图中蓝色越深表示影响越大。可以看到,对于一大群基因,任意和其他基因的组合都有比较严重的影响——也就是图中的成带状的图。这说明,对于这些基因,组合组合溢出效益基本不用考虑,去掉单独的那个已经影响很大,再去掉另一个基因不会产生严重的多的影响。但是,其中另外一些,只出现在孤立的地方——见图中那些孤立的蓝色点。这说明,单独去掉其中一个基因都没有太大的影响,但是,同时去掉两个则能够有很大的影响。

用广义投入产出分析研究系统的时候,都可以讨论一下这个组合溢出效益。

FBA GeneKnockout.png

  下面简单介绍一下两基因和三基因敲除实验的两篇论文。
  酵母基因组中,大约有6000个基因,在单个基因敲除实验中发现有近1000个是维持生命所必要的,必需基因中哪怕有一个基因缺失,整个机体就会死亡。而似乎其他非必需基因的单独缺失就不会导致这样的结果。
  为了进一步研究基因的作用, Michael Costanzo等人为了研究了敲除两个基因的效果[9], 培育了2000万的缺少两个基因的酵母菌株,涵盖了在6000个基因中敲除两个基因所有的组合方式。通过研究菌群的大小来量化敲除两个基因的效果,进而计算基因之间的相互作用强度 , 由敲除基因ij后的菌群大小计算而来,而由敲除基因i后菌群大小计算,构建了二元基因相互作用网络。发现必需基因之间的联系比非必需基因之间联系紧密,此外发现敲除两个非必需基因能对大量生物学过程产生显著影响,这些现象在单基因敲除实验中并不明显,见下图或文献[9]的图1。

两基因相互作用网络

  然而,在两基因敲除实验过程中,仍然有相当多的基因与其他基因并没有明显的相互作用,因此Elena Kuzmin等人又进行三基因敲除实验[10],根据一定规则选取了151对双基因,然后与其他基因组合产生三基因的突变体,三基因相互作用强度定义如下
  构建了三元基因相互作用网络,发现大约三分之一的连接是新连接,即在二元相互作用网络中没有出现 ,而三分之二是对原来关系的补充。有趣的是发现MDY2和MTC1这两个基因在二元相互作用网络中进参与了少量(2个)的生物学过程,但是在三元相互作用网络中,MDY2和MTC1与其他基因做成的三元组参与了8个生物学过程,见下图或文献[10]图4。

三基因相互作用网络

  研究结果表明三元相互作用桥接了较远的生物学过程,多个基因的组合在物种形成过程中起着关键作用。

相关研究工作

  1. 从方法上对比原始投入产出分析、目标外界投入产出分析、封闭系统投入产出分析、PageRank分析、向前向后分析在概念和结果上的区别
  2. 用于CO2排放[11][12]等环境科学问题的研究[13][14] [15] [16][17][18][19][20]
  3. 世界贸易[21]
  4. 房地产、 金融业、旅游业、政府购买对中国经济的贡献,与国际的对比
  5. 中国产业结构也就是矩阵的变化的影响
  6. 建立产品层次的投入产出网络,做分析,而不是部门层次的,可以放开上面的第一个局限性。没有实际产品生产关系的数据,就拿化学反应的数据先做一个方法和可研究的问题的讨论
  7. 科学研究领域之间、科学领域和技术部门之间的投入产出关系[22]
  8. 中国增加一个对美国文章的引用的直接和间接效果,美国增加了一个来自于中国施引的直接和间接效果
  9. 论文在引用网络内部综合考虑直接和间接的影响力、论文在考虑了产品和专利之后的影响力、论文在考虑了第一次提出和后续使用概念以及通过被引用和概念沉淀进入教材之后的影响力
  10. 企业内部部门的影响力衡量和重要(瓶颈)部门的发现
  11. 中国创造一个就业机会(科学家职位)、培养一个工作者(科学家)的直接和间接效果

参考文献

  1. 1.0 1.1 1.2 Miller, R., & Blair, P. (2009). Input–output analysis: Foundations and extensions (2nd ed.). Cambridge, UK: Cambridge University Press.
  2. Arnold Tukker & Erik Dietzenbacher (2013) GLOBAL MULTIREGIONAL INPUT–OUTPUT FRAMEWORKS: AN INTRODUCTION AND OUTLOOK, Economic Systems Research, 25:1, 1-19, DOI: 10.1080/09535314.2012.761179
  3. Brin S, Page L (1998) The anatomy of a large-scale hypertextual web search engine. Computer Networks and ISDN Systems 30:107–117.
  4. Chen P, Xie H, Maslov S, Redner S (2007), Finding scientific gems with Google. J Informetrics 1:8–15.
  5. Sergei Maslov and Sidney Redner (2008), Promise and Pitfalls of Extending Google's PageRank Algorithm to Citation Networks, Journal of Neuroscience 29, 28 (44) 11103-11105(2008). DOI:10.1523/JNEUROSCI.0002-08.2008 . (http://www.jneurosci.org/content/28/44/11103)
  6. J.D. West, T.C. Bergstrom, C. T. Bergstrom, The Eigenfactor Metrics: A network approach to assessing scholarly journals, College & Research Libraries 71(3): 236-244(2010), doi: 10.5860/0710236
  7. Fragkiadaki E. and Evangelidis G. (2014), Review of the indirect citations paradigm: theory and practice of the assement of papers, authors and journals, Scientometrics 99:261-288 (2014).
  8. Jeffrey D Orth, Ines Thiele & Bernhard Ø Palsson, What is flux balance analysis? Nature Biotechnology 28, 245–248 (2010).
  9. 9.0 9.1 Costanzo M. et al. (2016). A global genetic interaction network maps a wiring diagram of cellular function. Science 253 aaf1420.
  10. 10.0 10.1 Kuzmin E. et al. (2018). Systematic analysis of complex genetic interactions.Science 360, eaao1729.
  11. Davis S. & Caldeira K. (2010). Consumption-based accounting of CO2 emmissions. PNAS 107(12):5687-5692.
  12. Feng K. et al. (2013). Outsourcing CO2 within China. PNAS 110(28):11654-11659.
  13. Hubacek, K., Baiocchi, G., Feng, K., Mu ̃noz Castillo, R., Sun, L., & Xue, J. (2017). Global carbon inequality. Energy, Ecology and Environment ,2, 361–369. https://doi.org/10.1007/s40974-017-0072-9 .doi:10.1007/s40974-017-0072-9.
  14. Acquaye, A., Feng, K., Oppon, E., Salhi, S., Ibn-Mohammed, T., Genovese, A., & Hubacek, K. (2017). Measuring the environmental sustainability performance of global supply chains: A multi-regional input-output analysis for carbon, sulphur oxide and water footprints. JOURNAL OF ENVIRONMENTAL MANAGEMENT,187, 571–585. doi:{10.1016/j.jenvman.2016.10.059}.
  15. Ayres, R., & Kneese, A. (1969). PRODUCTION, CONSUMPTION, AND EXTERNALITIES. AMERICAN ECONOMIC REVIEW, 59, 282–297.
  16. Leontief, W (1970). Environmental repercussions and economic structure - input-output approach. REVIEW OF ECONOMICS AND STATISTICS, 52, 262–271. doi:{10.2307/1926294}.
  17. Mi, Z., Meng, J., Zheng, H., Shan, Y., Wei, Y.-M., & Guan, D. (2018). A multi-regional input-output table mapping China’s economic outputs and interdependencies in 2012. Scientific Data, 5, 180155.
  18. Turner, K., Lenzen, M., Wiedmann, T., & Barrett, J. (2007). Examining the global environmental impact of regional consumption activities - Part 1: A technical note on combining input-output and ecological footprint analysis. ECOLOGICAL ECONOMICS, 62, 37–44. doi:{10.1016/j.ecolecon.2006.12.002}.
  19. Wiedmann, T., Lenzen, M., Turner, K., & Barrett, J. (2007). Examining the global environmental impact of regional consumption activities - Part 2: Review of input-output models for the assessment of environmental impacts embodied in trade. ECOLOGICAL ECONOMICS, 61, 15–26. doi:{10.1016/j.ecolecon.2006.12.003}.
  20. Wiedmann, T. O., Schandl, H., Lenzen, M., Moran, D., Suh, S., West, J., & Kanemoto, K. (2015). The material footprint of nations. PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, 112, 6271–6276. doi:{10.1073/pnas.1220362110}.
  21. Leonie Wenz and Anders Levermann.(2016). Enhanced economic connectivity to foster heat stress-related losses. Science Advances Vol. 2, no. 6, e1501026.
  22. Zhesi Shen, Liying Yang, Jiansuo Pei, Menghui Li, Chensheng Wu, Jianzhang Bao, Tian Wei, Zengru Di, Ronald Rousseau, Jinshan Wu, Interrelations among scientific fields and their relative influences revealed by an input–output analysis, Journal of Informetrics 10, 82-97(2016). Doi:10.1016/j.joi.2015.11.002.