我们给出了不含余子的图的多项式时间性质的一个逻辑刻画:对于每一类<我>C我>一些图<我>H我>难道没有一个图的小调在里面吗<我>C我>房地产<我>P我>的图<我>C我>在多项式时间内是可决定的,当且仅当它在带计数的定点逻辑中可定义。进一步,我们证明了对每个类<我>C我>对于不包含小数的图,有一个<我>k我>这样一个简单的组合算法,即“the<我>k我>-维WeisfeilerLehman算法,决定了图的同构性<我>C我>在多项式时间内。
难以描述的问题也难以解决,反之亦然我>.这种说法乍一看可能很天真,甚至是错误的,但它是一种深层的、富有成效的联系<我>描述性的复杂性我>和<我>计算复杂度我>计算的问题。在这里,描述复杂度是指用形式语言或逻辑表达问题所需的“语言资源”,而计算复杂度是指解决问题所需的计算资源。这种联系可以追溯到可计算性理论的起源。例如,递归可枚举(或半可决定)的自然数集恰恰是算术语言中一阶逻辑的存在公式所能定义的集。<年代up>15一个>这样的公式由一个存在量词的前缀和几个变量中多项式之间的方程的布尔组合组成。
在今天的计算理论中,我们对可计算集和递归可枚举集的类不太感兴趣,而对诸如类这样复杂得多的类更感兴趣PTIME
在所有多项式时间可解的问题中NP
.此外,我们很少将计算问题建模为自然数集。相反,我们的基本模型是有限图和其他有限结构,如标记转换系统、布尔电路和关系数据库。(为了简单起见,我们在本文中主要考虑图表。)现代描述复杂性理论的起点是费金定理,<年代up>3.一个>说明有限图(或其他结构)的一个性质当且仅当它在非确定性多项式时间内可决定时,才可在存在二阶逻辑中表示。更简单地说,我们称之为存在二阶逻辑<我>捕捉我>NP
.类似的逻辑特征已经得到了其他复杂性类,如多项式时间层次结构PH值
而且PSPACE
.但是,目前还不知道捕获该类的逻辑PTIME
或者下面的任何自然复杂性类PTIME
.因此,我们缺乏对我们最感兴趣的问题的逻辑描述——那些可以有效解决的问题!
问题是是否有一种逻辑PTIME
是钱德拉和哈雷尔最先养大的<年代up>2一个>1982年在一篇关于数据库查询语言的基础论文中。钱德拉和哈雷尔要求为关系数据库提供一种查询语言,精确地表达那些可以在多项式时间内求值的查询。显然,拥有这样一种语言将非常好:它将允许用户只询问能够有效回答的查询,同时保证所有这样的查询都可以被询问。古雷维治<年代up>7一个>从逻辑上重新提出这个问题。他对“逻辑捕获”的精确定义PTIME
“是微妙的;我们将在下面讨论它。古雷维治<年代up>7一个>推测没有逻辑捕获PTIME
.注意这个猜想暗示着什么PTIME
NP
,因为根据费金定理有一个逻辑NP
.是否存在逻辑捕获的问题PTIME
至今仍是开放的,它被视为有限模型理论和数据库理论的主要开放问题之一。只有部分的肯定答案是已知的,最著名的是ImmermanVardi定理<年代up>10一个>,<一个href="#R22">22一个>说明定点逻辑捕获的最小值PTIME
关于有序结构(见第1.2节)。
1.1.捕获多项式时间的逻辑
那么到底是什么构成了一个逻辑PTIME吗?
第一个要求(L1)是逻辑l
应该有一个<我>可决定的语法我>,即可计算的集合<我>句子我>.为了定义语义,我们关联a<我>属性页我>的有限图(或其他结构)的每句l
.我们说<我>定义P我>这<我>P我>是<我>可下定义的我>在l
.为l
捕捉PTIME
,我们要求(L2)每个图的属性在PTIME
在…中可定义的l
相反,每个属性都可以定义在l
可决定的:在…上可决定的PTIME
.但这还不够;我们仍然缺少句子和它们所定义的属性之间的有效联系。因此,我们要求(L3)存在一种算法,该算法与的每个句子相关联l
“评估算法”<我>一个我>决定房地产<我>P我>在多项式时间内。这就完成了定义:我们这样说<我>一个逻辑我>PTIME
如果它满足(L1)(L3)
例1。<我>考虑一阶谓词逻辑我>佛
.<我>例如,我>佛
字句我>x我>E(x, y)在图的语言中定义了没有孤立顶点的图的性质。(“每个顶点都有一个邻居。”)它可以显示我>佛
满足标准我>(<我>l我>1)<我>而且我>(<我>l我>3),<我>但不是我>(<我>l我>2)。<我>因此它不是一个逻辑捕获PTIME
.
为什么我们对逻辑捕获感兴趣PTIME吗?
毕竟,逻辑只是另一种可以用来描述计算的形式主义,就像图灵机、lambda微积分、各种语法和重写系统,或者“真正的”编程语言一样。但是在捕获复杂性类的逻辑和其他形式主义之间有一个重要的区别:逻辑直接涉及图和结构,而大多数其他形式主义操作的是通过字符串或术语对结构进行编码。因此,复杂性类的逻辑描述是<我>representation-independent我>.这似乎是一个小的技术问题,但实际上是相当重要的,主要是因为我们没有自然<我>规范的表示我>但当我们构造这样的表示形式时,必须作出任意的选择。
例2。<我>表示图的标准方法是通过它们的邻接矩阵;一旦我们有了一个邻接矩阵,我们就可以得到a我>{0,1} -<我>通过连接矩阵的行对图进行编码的字符串我>.
考虑图中显示的图表我>1(<我>一个我>).<我>数字我>1(<我>b我>)<我>显示了该图的三个不同的邻接矩阵,导致了中所示的三个不同的字符串编码我>图1一个>(<我>c我>).<我>的确,图表上有我>4 != 24<我>邻接矩阵,每个顶点的线性顺序对应一个我>(<我>图中的三个矩阵我>1<我>对应订单abcd, acbd, cabd)。并不是所有的我>24<我>矩阵是不同的,但没有一个我们可以宣称是“正确的”表示我>.
我们习惯于认为图是抽象的模型,认为图的属性只取决于图本身,而不取决于它们的具体表示。图属性的例子有“连通性”、“非循环性”或“哈密顿性”(即,有一个循环,只遍历每个顶点一次)。我们不会把“第一个顶点的度数为3”这样的语句看作描述一个图的属性,因为图没有明确的“第一个”顶点。
这个抽象级别是我们模型中不可分割的一部分。例如,如果我们使用网络的图形模型,那么我们就会有意地从节点的物理位置中抽象出来(否则我们就应该使用不同的模型)。同样,将数据库的逻辑层与物理层分离是关系数据库模型的一个特性,而不是一个缺陷。
在这些抽象模型和典型的算法之间存在着不匹配。图算法并不获取一个抽象图作为输入,而是得到这个图的具体表示,通常是邻接矩阵或邻接表。然而,预计其结果将独立于具体的代表性。但是我们如何保证一个特定的图算法是与表示无关的呢?不幸的是,无法确定算法是否具有这种属性。事实上,我们所知道的许多标准图算法内部都依赖于输入的特定表示形式,而恰好在输出中是与表示无关的。一个典型的例子是基于深度优先搜索的连通性算法。在图的任何顶点上,深度优先搜索选择顶点的“第一个”邻居继续搜索。但是没有规范的第一近邻;它取决于输入图的具体表示形式,哪个邻居在前面。
我们可能会问,是否有一种编程语言强制表示独立,即所有语法正确的程序都是表示独立的,同时允许我们为图的所有可决定属性实现算法。想出这样一种语言并不太难,虽然不是很自然。但付出的代价似乎是效率的巨大损失。是否存在逻辑捕获的问题PTIME
可以重新定义为要求一种编程语言,它强制表示独立性,同时允许我们实现图的所有属性的多项式时间算法,这些属性可以由处理图的特定表示的传统算法在多项式时间内决定。(通过<我>多项式时间算法我>在我们的新语言中,我们指的是可以在传统机器上以多项式时间执行的程序。
1.2.在不包含子项的图上捕获多项式时间
如前所述,是否存在逻辑捕获的问题PTIME
仍然开放,但有部分积极的结果,具体类别的结构。本文的主要定理就是这样一个结果。非正式地,逻辑l
捕捉我>PTIME
在C级我>中结构的多项式时间性质<我>C我>是可确定的l
.(我们不给出形式化的定义,它是逻辑捕获的一般定义的直接改编PTIME
.)
一个<我>结构我>由一个<我>宇宙我>这只是一个有限的集合,是这个宇宙中关系、函数和常数的有限集合。(一般来说,结构可能有无限的宇宙和无限多的关系、函数和常数,但在描述复杂性时,我们将注意力限制在有限的结构上。)一个<我>有序的结构我>是一种具有独特二元关系的结构,即宇宙的线性秩序。例如,一张图<我>G我>= (<我>V E我>)是一个有宇宙的结构<我>V我>和一个二元“边”关系<我>E我>.有序图是三重(<我>V E我>, <),其中(<我>V E我>)是一个图,<是的线性顺序<我>V我>.有序结构在描述复杂性理论中扮演着特殊的角色,因为它们允许规范的字符串表示。例2。我们看到,对于图的每一个线性顺序的顶点,都有一个邻接矩阵,从这个邻接矩阵中,我们可以得到一个{0,1}-字符串来表示图。因此对于有序图<我>G我>= (<我>V E我>, <)我们有一个规范的字符串表示:我们表示<我>G我>由(的邻接矩阵派生的字符串<我>V E我>)对应于<的线性顺序<我>V我>.这可以从有序图推广到任意有序结构。因此,当我们处理有序结构时,表示独立性的问题就消失了。
1982年,Immerman<年代up>10一个>和瓦迪,<年代up>22一个>独立地证明<我>至少定点逻辑我>《外交政策》
捕获所有有序结构类上的多项式时间。《外交政策》
是通过定点运算符对一阶谓词逻辑的扩展,它允许将归纳定义形式化。在本文中,我们不会看到很多逻辑公式,并且在不需要任何语法和语义详细知识的情况下,从较高的层次上处理逻辑。然而,由于《外交政策》
将发挥核心作用,也许有必要简单地看看它的主要机制:
例3。<我>假设我们要定义图G = (V, E)的边关系的传递闭包T。众所周知,这在一阶逻辑中是不可能的。但是传递闭包允许以下归纳定义:我们让T我>1年代ub>:=<我>E,为所有的i,我们让T我>我我>+ 1年代ub>是所有(u, v)对的集合,使顶点w与(v, w)<我mg src="https://dl.acm.org/cms/attachment/ca49bf4b-37ea-46de-9c98-00ff570b5acf/isin.gif" border="0" hspace="2" alt="isin.gif">T我>我我>和(w, u)<我mg src="https://dl.acm.org/cms/attachment/ca49bf4b-37ea-46de-9c98-00ff570b5acf/isin.gif" border="0" hspace="2" alt="isin.gif">T我>我我>.<我>那么T就是所有T的并集我>我我>.<我>等价地,我们可以定义T为我>最小不动点<我>的(单调)算符我>
在这里<我mg src="https://dl.acm.org/cms/attachment/93e56638-9624-41df-a175-de6754c79378/or.gif" border="0" hspace="2" alt="or.gif">而且<我mg src="https://dl.acm.org/cms/attachment/589409d8-30a7-418a-9163-788d5d114a7f/and.gif" border="0" hspace="2" alt="and.gif">分别表示分离和连接。在我>《外交政策》
,<我>我们可以形成一个公式我>
来定义传递闭包。如果我们称这个公式为我>tc (<我>v, w我>),那么《外交政策》
-<我>句子我>康涅狄格州
:=<我mg src="https://dl.acm.org/cms/attachment/34e4088e-b53c-450f-ac23-0b1fd7b757ad/forall.gif" border="0" hspace="2" alt="forall.gif">v我>w我>(<我>v我>=<我>w我>tc
(<我>v, w我>))<我>定义连接的(无向)图的属性我>.
标准技术可以证明《外交政策》
不能在所有结构上捕获多项式时间,最明显的原因是逻辑缺乏计数能力。例如,具有偶数个顶点的图属性在中是无法定义的《外交政策》
.20世纪80年代末,伊曼<年代up>11一个>猜想<我>定点逻辑计数我>FP + C
,一种最小不动点逻辑的扩展,通过一种允许它定义可定义集的基数的机制,可以捕获多项式时间。除图的顶点外,在FP + C
我们也可以讨论从0到图的大小的整数。逻辑中提供了对这些整数的标准算术运算。整数的主要用途是表示基数。
例4。<我>回想一下,一个我>欧拉周期<我>图中的每条边恰好出现一次的闭合游走。一个图我>欧拉<我>如果它有欧拉循环。这是一个众所周知的事实(回到欧拉),一个图是欧拉的当且仅当它是连通的并且每个顶点都有偶度我>.
术语#x' E(x, x')计算图中顶点x的邻结点x'的个数。因此,公式我>
其中x和x'是在图顶点范围内的变量y是在整数范围内的变量,表示顶点x是偶次的。最后,FP + C
字句我>
在哪里我>康涅狄格州
是我>《外交政策》
-<我>在例3中定义的句子中,表示一个图是欧拉的我>.
尽管1992年蔡等人。<年代up>1一个>驳斥了伊默曼的猜想FP + C
捕获多项式时间,从那时起FP + C
确实在许多有趣的结构类别上捕捉到了多项式时间,其中包括树,<年代up>12一个>有界树宽度图,<年代up>6一个>平面图形、<年代up>5一个>和区间图。<年代up>13一个>赫拉et al。<年代up>8一个>证明FP + C
捕获几乎所有结构的多项式时间(在精确的技术意义上)。
我们的主定理推广了许多这些结果。为了说明这一点,我们需要定义图的子图。一个图表<我>H我>是一个<我>小我>的图<我>G我>如果<我>H我>的子图得到的图是否同构<我>G我>通过收缩边缘(参见<一个href="#F2">图2一个>一个例子)。我们说<我>H我>是一个<我>排除小我>为一个类<我>C我>的图<我>H我>难道没有一个图的小调在里面吗<我>C我>.
定理1。<我>设C是一类至少有一个排除子的图。然后定点逻辑计数(FP + C
)捕获C上的多项式时间我>.
具有排除小次的图类的例子有平面图类(具有5个顶点的完整图,<我>K我>5年代ub>,是一个排除小子),对于每一个曲面<我>年代我>所有可嵌入的图形的类<我>年代我>(每一个完全图<我>K我>k我>这样,(<我>k我>3) (<我>k我>4)/6大于属<我>年代我>是一个排除的小类),所有可以嵌入到R<年代up>3.年代up>以致没有一个循环不是简单的打结(<我>K我>7年代ub>是排除的次要),为每<我>k我>顶点覆盖最多为大小的所有图的类<我>k我>(<我>K我>k我>+ 2年代ub>是排除的次要),为每<我>k我>所有反馈顶点集不超过大小的图的类<我>k我>(<我>K我>k我>+ 3年代ub>是排除的未成年人),和为每<我>k我>最多树宽的所有图的类<我>k我>(<我>K我>k + 2年代ub>是一个被排除的未成年人)。为了说明我们的定理的局限性,让我们还提到,所有三次图(即每个顶点恰好有三个邻点的图)的类不排除任何图作为次图。
定理1的一个结果是一个简单的多项式-时间同构检验,它适用于所有不包含余子的图类<我>C我>一种通用的组合“颜色细化”算法,称为<我>k维WeisfeilerLehman算法我>,确定图的同构性<我>C我>.值得注意的是,该算法没有建立在图的任何特殊图论性质上<我>C我>可能有,只有参数<我>k我>取决于<我>C我>.算法也不使用任何逻辑;逻辑只是用来证明它是有效的。我们将在第6节中描述算法,该部分可以独立于本文的其余部分阅读。
为了证明定理1,我们建立了一个<我>可确定的结构理论我>对于排除了余子项的图。它建立在由Robertson和Seymour开发的带有被排除小子的图的结构理论之上(见第2节),但最终导致了图的完全不同的结构分解。在图论方面,我们的理论的主要新方面是,我们需要识别具有自同构下不变的不包含子数的图的结构性质,这是使它们可定义的先决条件(参见3.1节的讨论)。在逻辑方面,我们必须找到一个可定义分解的概念,它足够灵活,可以广泛应用,但仍然包含足够的信息,使我们能够证明定理1。<我>可定义的(有序的)树状分解我>,这将在第4节中讨论,满足这些要求。我们开发的许多可定义结构理论都是相当普遍的,并不是专门针对有排除余子的图,而且它可能会找到其他应用。
定理1的完整证明非常长,超过200页,将以专著的形式发表,初稿可在<一个href="http://www2.informatik.hu-berlin.de/~grohe/pub/cap/">http://www2.informatik.hu-berlin.de/~grohe/pub/cap/一个>.
不含子的图的结构具有很强的拓扑性质。因此,在我们描述它之前,我们简要回顾了一些关于表面拓扑的事实。曲面是拓扑空间,局部看起来像平面(“双流形”);此外,表面要求连接紧密。它们可以被分为两个无限的家族:的第一个家族<我>可定向的表面我>由球体、环面(“甜甜圈”)、双环面、三环面(“椒盐卷饼”)等组成。的第二族的表面<我>nonorientable表面我>从球体上切割出有限个不相交的圆盘,然后将Möbius条粘在所有的孔上(见<一个href="#F3">图3一个>).用一条Möbius条,这产生了投影平面和两条Möbius条克莱因瓶。描述曲面的一个方便的参数是它<我>欧拉属我>对于一个可定向的表面,它是孔数的两倍(例如,一个椒盐卷饼的6个),而对于一个不可定向的表面,它是在其构造中使用的Möbius条的数量。一个图<我>可嵌入我>在一个表面上,如果它能画在一个表面上而不交叉边。
在一系列的论文中,罗伯逊和西摩<年代up>19一个>发展了一个排除余子图的结构理论。在罗伯逊和西摩的作品中,<年代up>20.一个>他们证明了一个结构定理,该定理说的是,带有排除余子项的图可以被分解为<我>几乎可嵌入我>到一些表面。这些作品以树状的方式排列。直观地说,几乎将一个图嵌入到一个曲面中就意味着首先从图中移除有限数量的顶点(这些顶点称为<我>极点我>),然后在曲面上绘制图形的其余部分,除了在有限数量的区域(称为<我>漩涡我>),使表面结构可能受到破坏。高层结构说明在<一个href="#F4">图4一个>.每个旋涡都附着在圆盘上一个“洞”的边界上。描述涡旋的结构超出了本文的范围;主参数称为<我>宽度我>是指涡旋中“穿过孔洞”的不相交路径的最大数目。涡旋的宽度应该在一个几乎可嵌入的图中有界。因此总的来说,在几乎可嵌入性的定义中有四个参数:表面、顶点的数量、漩涡的数量和漩涡的宽度。这些参数取决于被排除的子数。
在Robertson和Seymour对著名的图小定理的证明中,排除余子图的结构定理起着核心作用,<年代up>21一个>说明每一类在取余子项下封闭的图都可以被有限个排除余子项所表征。结构定理也有各种算法的应用。
最终,所有已知的关于在结构类上捕获多项式时间的结果都被证明为有序结构的约简和ImmermanVardi定理,我们的定理1也不例外。这些约简要么通过在考虑的结构上定义线性顺序,要么通过定义结构的有序副本(这种方法称为<我>可确定的圣典我>).在本节中,我们将简要讨论这两种方法,并通过一些示例来说明它们。然后在第四节中,我们将介绍可定义结构理论的关键概念,<我>可定义的有序树状分解我>.从本质上讲,这些是将图分层分解成我们可以定义线性顺序的片段。一旦我们在逻辑中定义了这样的分解,我们将看到这一点《外交政策》
在一个类<我>C我>我们可以证明它FP + C
捕捉PTIME
在<我>C我>.对技术细节不感兴趣的读者可以安全地跳过这部分的其余部分和下面的部分,继续阅读第5节,在第5节中,我们展示了排除了余项的图类允许可定义的有序树状分解《外交政策》
.
3.1.图、同构和可定义关系
一个图的顶点集<我>G我>用<我>V我>(<我>G我>)和边缘设置<我>E我>(<我>G我>).同构图的同构<我>G我>一个图<我>H我>是一对一的映射<我>f我>从<我>V我>(<我>G我>)<我>V我>(<我>H我>),这样对于所有的顶点<我>u我>,<我>v我>V我>(<我>G我>)我们有<我>紫外线我>E我>(<我>G我>)当且仅当<我>f我>(<我>u我>)<我>f我>(<我>v我>)<我mg src="https://dl.acm.org/cms/attachment/ca49bf4b-37ea-46de-9c98-00ff570b5acf/isin.gif" border="0" hspace="2" alt="isin.gif">E我>(<我>H我>).第1.1节中讨论的图属性的表示无关性可以重铸为<我>同构下的不变性我>:如果一个图形<我>G我>有一个属性<我>P我>这里有一个同构<我>G我>一个图<我>H我>,然后<我>H我>有财产<我>P我>也一个<我>自同构我>的图<我>G我>是一种同构<我>f我>从<我>G我>来<我>G我>;它是<我>非平凡的我>如果<我>f我>(<我>v我>)<我>v我>至少有一个<我>v我>.
本文中出现的所有公式都是《外交政策》
公式或FP + C
图解语言中的公式。自由变量总是在图的顶点上。通过编写<我>(<我>x, y我>)表示公式的自由变量<我>都是<我>x, y我>,<我>G我>[<我>u, v我>)意味着<我>G我>满足<我>如果<我>x我>是被<我>u我>而且<我>y我>是被<我>v我>.这是一个关于可定义性的重要事实(不仅仅是在《外交政策》
而且FP + C
可定义的集合和关系<我>不变的同构下我>.也就是说,如果<我>(<我>x我>1年代ub>、……<我>x我>k我>)是一个公式,<我>G我>是一个图表,和<我>f我>的自同构<我>G我>然后对所有<我>v我>1年代ub>、……<我>v我>k我>V我>(<我>G我>)我们有<我>G我>[<我>v<年代ub>1年代ub>、……v<年代ub>k年代ub>当且仅当<我>G我>[<我>f我>(<我>v<年代ub>1年代ub>),…<我>f我>(<我>v<年代ub>k年代ub>)]。
3.2.可定义线性订单
证明逻辑捕获的最简单方法PTIME
在一个类<我>C我>中的图的线性阶是通过定义图的线性阶来实现的<我>C我>的逻辑。例如,在有向路径上,我们可以很容易地定义线性顺序《外交政策》
:有向路径的边关系的传递闭包恰好是路径顶点的线性顺序,我们在例3中已经看到,传递闭包是可定义的《外交政策》
.对于其他结构,我们不能直接定义线性阶数,而需要在定义中加入“参数”。例如,在无向路径上,不可能在没有参数的情况下定义线性顺序,因为没有规范的方法来定义路径的哪个端点先出现。更一般地说,如果一个图具有非平凡自同构,那么就不可能在这个图上定义一个线性顺序。然而,如果我们固定无向路径的一个端点,那么我们可以在逻辑中定义一个线性顺序《外交政策》
.类似地,如果我们固定一个循环中的两个相邻顶点,我们可以定义一个循环的线性顺序(参见<一个href="#F5">图5一个>).一般来说,我们说一个公式(<我>x我>,<我>y我>,<我>z我>1年代ub>、……<我>z我>k我>)<我>定义线性顺序我>在一个图表<我>G参数我>z我>1年代ub>、……<我>z我>k我>如果有顶点<我>w我>1年代ub>、……<我>w我>k我>使得二元关系{(<我>u, v我>)<我mg src="https://dl.acm.org/cms/attachment/ca49bf4b-37ea-46de-9c98-00ff570b5acf/isin.gif" border="0" hspace="2" alt="isin.gif">V我>(<我>G我>)<年代up>2年代up>|<我>G我>[<我>u, v, w我>1年代ub>、……<我>w<年代ub>k年代ub>的线性顺序<我>V我>(<我>G我>).我们说一个类<我>C我>的图<我>承认我>《外交政策》
-<我>可定义线性订单我>如果有《外交政策》
中的所有图定义线性顺序的公式<我>G我>C我>.根据ImmermanVardi定理,如果一个类<我>C我>承认《外交政策》
-可定义的线性顺序《外交政策》
捕捉PTIME
在<我>C我>.
3.3.可确定的圣典
图,承认《外交政策》
-可定义的线性顺序往往很少;即使是没有边的平凡图也不承认《外交政策》
可定义线性订单。幸运的是,有一种方法可以避免这个问题。而不是一个顺序,我们定义一个<我>命令复制我>的图。注意它们的区别:如果我们在图上定义了一个顺序,我们就确切地知道哪个顶点是第一个、第二个等等。如果我们只有一个有序的副本(但没有将原始图的顶点与副本的顶点关联起来的映射),它不会给我们任何关于原始图的单个顶点的额外信息。然而,一份订购的拷贝可能非常有用。例如,我们可以用它来得到图的标准邻接矩阵。但我们如何在逻辑上定义一个图的有序副本,而不实际定义顶点的线性顺序呢?我们可以用三重(<年代ub>V我>(<我>x我>),<年代ub>E我>(<我>x, y我>),<年代ub><年代ub>(<我>x, y我>)的公式:应用于图<我>G我>,我们想用这些公式来定义一个集合<我>V '我>: = {<我>一个我>|<我>G我>v年代ub>[<我>一个我>},一个二进制关系<我>E”我>: = {<我>ab我>|<我>G我>E年代ub>[<我>一个我>,<我>b我>}和一个二进制关系<':= {<我>ab我>|<我>G我><年代ub>[<我>一个我>,<我>b我>)},<我>G我>”:= (<我>V我>”,<我>E我>)是同构的图<我>G我><'是的线性顺序<我>V我>”。三倍(<年代ub>V我>(<我>x我>),<年代ub>E我>(<我>x, y我>),<年代ub><年代ub>(<我>x, y我>)被称为<我>转导我>或<我>语法解释我>.我们通常用由FP + C
公式。记住,在FP + C
我们不仅可以讨论图的顶点,也可以讨论整数的初始段。诀窍是使用整数表示输入图副本的顶点,然后使用整数的自然顺序作为这些顶点上的顺序。
例5。<我>k *有k我>+ 1<我>顶点,一我>中心<我>和k我>射线。<我>每条射线都有一条到中心的边,没有其他的边。利用恒星有许多自同构的事实,可以证明所有恒星的类别不允许可定义的线性顺序我>.
我们可以定义一个有序副本我>(<我>V我>”,<我>E我>”,<)<我>通过V得到k * S我>':={0,1,…,<我>k我>},<我>E我>”:= {0<年代ub>我我>| 1<我>我我>k我>}<我>让<'是V上的自然顺序'我>(<我>看到我>图6一个>).<我>的定义我>(<我>V我>”,<我>E我>' < ')<我>可以很容易地用我>FP + C
计数在这里是至关重要的,因为不计数的定点逻辑无法确定一颗恒星有多少射线我>.
我们说一个类<我>C我>的图<我>承认我>FP + C
-<我>可确定的圣典我>如果有FP + C
中每个图的有序拷贝定义的转换<我>C我>.根据ImmermanVardi定理,如果一个类<我>C我>承认FP + C
可确定的圣人——然后FP + C
捕捉PTIME
在<我>C我>.使用可定义的规范化来捕获多项式时间的想法可以追溯到Immerman和Lander。<年代up>12一个>奥托对它进行了深入的研究。<年代up>17一个>例5显示了恒星的类别允许FP + C
可确定的推崇。通过递归地应用相同的思想,Immerman和Lander<年代up>12一个>能证明所有树的类都承认吗FP + C
可确定的推崇。
定理1证明的关键思想是以树形方式将不包含余子数的图分解为“简单”块,在这些“简单”块上我们可以定义线性阶《外交政策》
然后使用一个类似于Immerman和Lander的可定义树封圣的论证<年代up>12一个>为了证明这些图表的正确性《外交政策》
可确定的推崇。
标准图论分解方法的基础是Robertson和Seymour的图的结构定理(见第2节)<我>树分解我>.一个<我>树分解我>的图<我>G我>是一对(<我>T我>,)由树组成<我>T我>以及与每个节点关联的映射<我>t我>的<我>T我>一套(<我>t我>)<我>V我>(<我>G我>),被称为<我>袋我>的<我>t我>,在一定的技术条件下,确保树的结构<我>T我>的连接结构近似<我>G我>.要在我们的上下文中使用树分解,我们必须在《外交政策》
或FP + C
.这是不可能的,因为树分解在底层图的自同构下通常不是不变的。我们通过引入一个更一般的分解概念来解决这个问题<我>树状我>.在树状分解中,我们替换了树<我>T我>基于有向无环图的树分解<我>D我>.这个想法是某些限制<我>D我>的子树生成树分解<我>G我>,通过包含许多这样的分解,我们可以在图的自同构下关闭树状分解。
要了解树状分解是什么样子的,请考虑一下<一个href="#F7">图7一个>,它显示了循环的树状分解<我>C我>4年代ub>:=({1,2,3,4},{12,23,34,41})。分解节点中的数字描述了袋子。的三个红节点形成树分解<我>C我>4年代ub>,两个蓝色节点也是如此。还有许多其他的树分解<我>C我>4年代ub>以类似的方式包含在树状分解中。注意整个分解的循环结构,它反映了底层循环的结构,也是分解在循环的自同构下不变性的原因。这种循环结构在树分解中消失了,比如由三个红节点组成的树分解。
树状分解图的树状分解<我>G我>是《外交政策》
-<我>可下定义的我>如果有《外交政策》
定义有向无环图顶点集和边集的公式<我>D我>还有袋子(<我>t我>)<我>t我>V我>(<我>D我>).例如,循环的树状分解<我>C我>4年代ub>所示<一个href="#F7">图7一个>是《外交政策》
可确定的。
一个<我>命令树分解我>的图<我>G我>由树状分解和每个包的线性顺序组成。一个有序的树状分解是《外交政策》
-<我>可下定义的我>如果它下面的树状分解是《外交政策》
-definable和它的包承认《外交政策》
可定义线性订单。一个类<我>C我>的图<我>承认我>《外交政策》
-<我>可定义的有序树状分解我>如果有公式在每个图上定义了有序的树状分解<我>C我>.下面的引理是对伊默曼和兰德引理的广泛推广FP + C
可定义的树木封圣。
引理1。<我>设C是一类允许我>FP + C
-<我>可定义的有序树状分解。然后C承认我>FP + C
-<我>可确定的圣典我>.
事实证明,在引理的应用中,我们甚至可以在逻辑中定义有序的树状分解《外交政策》。
定理2(可定义结构定理)。<我>每一类至少有一个排除子的图都允许我>《外交政策》
-<我>可定义的有序树状分解我>.
这个定理是我们的主要技术成果。它通过引理1和ImmermanVardi定理隐含了定理1。为了证明可定义结构定理,我们在以下六个步骤中描述的阶段中建立了分解。
第一步:平面图我>.我们首先证明三连通平面图允许《外交政策》
可定义线性订单。记住,图是<我>三个相互联结的我>如果删除任意两个顶点使其连接。证明的关键步骤是确定三连通平面的面循环《外交政策》
.我们使用的事实,追溯到惠特尼,即嵌入平面的三连通图的面循环(面的边界)正是无和弦和不分离的循环。特别地,这意味着对于图的每一个嵌入面循环都是相同的。一旦我们定义了面部循环,我们可以使用三个参数来固定一个面部循环,然后定义在《外交政策》
通过“绕着这个螺旋循环走”的线性顺序。
证明任意平面图都允许《外交政策》
-可定义的有序树状分解,我们证明了一个图的标准分解到它的三个连通的分量得到一个《外交政策》
可定义树分解。
步骤2:可嵌入曲面的图形我>.我们利用了一个事实,即每一个正欧拉属的表面都有一个<我>noncontractible周期我>.沿着这样的循环切割表面并将圆盘粘在孔上,就会产生一个或两个严格较小的欧拉属表面。
为了在可嵌入曲面的图上定义有序的树状分解,我们先对曲面的欧拉属进行归纳。平面图形是基本情况。在归纳步骤中,我们试图定义嵌入曲面中的图的面循环。如果我们成功了,那么我们就可以使用面循环来定义线性顺序,就像平面图形一样。或者我们发现了一个不可收缩的循环。然后我们可以删除这个循环,将归纳假设应用到嵌入在一个或两个严格较小的欧拉属曲面上的结果图上,并将我们得到的分解提升到原始图上,利用我们可以定义的事实《外交政策》
删除的循环上只有两个参数的订单。
步骤3:有界树宽度图我>.一个图<我>树的宽度我>最多<我>k我>如果它有树形分解,或者等价地,树形分解,其中每个袋子最多包含<我>k我>+ 1点。的<我>宽度我>是1加上袋子的最大基数。事实上我们可以定义树状的宽度分解<我>k我>在树宽度最多的图上<我>k我>.我们通过自下而上的方式归纳定义部分分解来做到这一点。一旦我们有了一个树状的宽度分解<我>k我>我们可以简单地定义袋子大小的线性顺序(<我>k我>+ 1)使用(<我>k我>+ 1)参数。
第四步:几乎是平面图形我>.还记得我们在第2节中对几乎可嵌入图的非正式描述吗?让<我>一个我>(<我>P q r s我>)是几乎最多可嵌入在欧拉属曲面上的所有图的一类<我>r我>在大多数<我>年代我>尖,最多<我>问我>涡旋,每个涡旋的宽度最多<我>p我>.在这一步和接下来的步骤中,我们要证明这一点<我>P q r s我>类<我>一个我>(<我>P q r s我>)承认《外交政策》
-可定义的有序树状分解。我们用归纳法继续<我>q + r我>.我们已经知道如何处理这门课了<我>一个我>(0,0,0,0)和更一般的类<我>一个我>(0, 0,<我>r我>, 0),最多可嵌入在欧拉属表面的所有图<我>r我>.
在这一步中,我们考虑类<我>一个我>(<我>p我>, 1, 0, 0)<我>几乎平面图形我>.我们把几乎平面的图形看作是嵌在圆盘上的图形,圆盘的边界上粘着一个漩涡。<一个href="#F8">图8一个>显示了一个示例。在这一步的关键引理中,实际上也是定理1的整个证明中最困难的引理之一,我们证明了距离涡旋足够远的近似平面图的面循环不依赖于特定的嵌入。也就是说,无论我们如何将图形划分为一个漩涡和一个嵌在圆盘上的部分,这些循环都会在圆盘上结束,它们将是面循环。此外,这些周期是《外交政策》
可确定的。我们称由这些循环引起的图的子图为<我>中心我>的图。使用面循环,我们可以在中心的每个连接组件上定义线性顺序。如果我们将中心的每个连接组件收缩为单个顶点,我们得到一个树宽度为的图<我>O我>(<我>p我>2一个>).使用步骤3,我们可以定义这个图的有序树状分解,并且可以使用中心分量的线性顺序将分解扩展为原始图的有序树状分解。
步骤5:几乎可嵌入的图我>.我们证明了类<我>一个我>(<我>P q r s我>)承认《外交政策》
-可定义的有序树状分解,通过一个类似于,但比第2步复杂得多的归纳结构。
步骤6:排除了未成年人的图我>.让<我>C我>是一类具有排除子函数的图。根据罗伯逊和西摩的结构定理,有<我>P q r s我>这样所有的图形<我>C我>有一棵树分解成碎片从<我>一个我>(<我>P q r s我>).如果我们可以定义这样的分解《外交政策》
,那么我们就可以使用图的可定义分解<我>一个我>(<我>P q r s我>中图的有序树状分解<我>C我>.但不幸的是,我不知道如何定义这样的分解《外交政策》。
相反,我们重复应用前面步骤的构造来归纳地构建一个图的有序树状分解<我>C我>以类似于步骤3的自底向上的方式进行部分分解。
是否存在多项式时间算法来决定两个图是否同构是一个长期悬而未决的问题。多项式时间同构检验用于许多自然图类,包括平面图类,<年代up>9一个>可嵌入固定曲面的图形类<年代up>4一个>,<一个href="#R16">16一个>更一般地,带有排除余子的图的类,<年代up>18一个>一类有界度图。<年代up>14一个>Luks有界度图的同构检验<年代up>14一个>涉及一些非平凡群论,以及许多后来建立在Babai、Luks和其他人在20世纪80年代早期开发的群论技术基础上的同构算法。特别是,Ponomarenko<年代up>18一个>排除余子图的同构算法在很大程度上建立在这些技术之上。
比群论算法简单得多的是组合算法称为<我>颜色细化我>或<我>顶点分类我>.它通过以下迭代过程计算图顶点的颜色:最初,所有顶点都有相同的颜色。然后在每一轮中,通过将不同的颜色分配给在上一轮中至少有一种颜色的邻居数量不同的顶点,来优化颜色。因此,在第一轮之后,当且仅当两个顶点具有相同的度数时,它们具有相同的颜色。在第二轮之后,两个顶点具有相同的颜色,当且仅当它们具有相同的度数和度数时<我>d我>相同数量的度的邻居<我>d我>.如果没有进一步的细化,算法将停止;这最多发生在之后<我>n我>轮,<我>n我>是输入图的顶点数。将颜色细化作为同构检验,应用于两个图的不相交并集。如果经过细化过程后,两个图的着色不同,也就是说,对于某些颜色而言<我>c我>这些图有不同数量的颜色顶点<我>c我>,那么我们就知道它们是非同构的。不幸的是,如果两个图有相同的颜色,它们可能仍然是非同构的。例如,考虑两个顶点数量相同的非同构正则图,例如一个长度为6的循环和两个长度为3的循环的不相交并集。即使它们是非同构的,它们也会得到相同的颜色。我们说颜色精致<我>区分我>两张图,如果它们的颜色不同。
的<我>k维WeisfeilerLehman算法我>(简称:<我>k-WL我>)是色彩精细算法的一种推广<我>k我>-元组的顶点代替顶点(参见Cai等。<年代up>1一个>查看算法的历史)。让<我>G我>作为输入图。最初,两个元组(<我>v我>1年代ub>、……<我>v我>k我>), (<我>w我>1年代ub>、……<我>w我>k我>)<我mg src="https://dl.acm.org/cms/attachment/ca49bf4b-37ea-46de-9c98-00ff570b5acf/isin.gif" border="0" hspace="2" alt="isin.gif">V我>(<我>G我>)<年代up>k我>如果映射得到相同的颜色<我mg src="https://dl.acm.org/cms/attachment/47746ec9-432a-4c17-a7e3-87bfa342c66e/cacm5406_d.gif" border="0" hspace="2" alt="cacm5406_d.gif">诱导子图是同构吗<我>G我>[{<我>v我>1年代ub>、……<我>v我>k我>}]到诱导子图<我>G我>[{<我>w我>1年代ub>、……<我>w我>k我>})。为<我>我我>k我>,我们说一个tuple (<我>v我>1年代ub>、……<我>v我>k我>)是一个<我>i-neighbor我>元组的(<我>w我>1年代ub>、……<我>w我>k我>)如果<我>v我>j我>=<我>w我>j我>对所有<我>j我>我我>.在每一轮算法中,通过给元组分配不同的颜色来优化颜色<我>我我>[<我>k我>和一些颜色<我>c我>有不同数量的<我>我我>邻居的颜色<我>c我>.如果没有进一步的细化,算法将停止;这最多发生在之后<我>n我>k我>轮。同样,同构图的颜色是相同的,我们这么说<我>k我>- wl<我>区分我>两个非同构图,如果它们的颜色不同。它不那么明显,有非同构图,不能区分<我>k我>-WL为任何固定<我>k我>3,更不用说<我>k我>=日志<我>n我>.Cai等人通过一个漂亮的结构,在有限模型理论中发现了其他几个应用。<年代up>1一个>证明了<我>n我>有非同构三正则<我>n我>顶点图<我>G我>n我>,<我>H我>n我>这是无法被区分的<我>k我>- wl为<我>k我>=<我>o我>(<我>n我>).他们还指出,WeisfeilerLehman算法和定点逻辑计数的可定义性之间存在联系。
基于这个联系,我们可以证明我们的第二个主要结果,即常维WL足以区分具有排除小子的图。因此,WeisfeilerLehman算法对每个类产生了一个简单的组合多项式-时间同构检验<我>C我>排除了余子的图。该算法完全避免了波诺玛连科算法复杂的群论机制。实际上,它是一种通用算法,除了选择参数外,没有为特定的输入图进行任何定制<我>k我>适当。
定理3。<我>对于每一类C的图,都有一个常数k,使得k- wl可以区分C中的任意两个非同构图我>.
定理3遵循可定义结构定理2和引理1(或直接从定理1通过奥托的一个结果<年代up>17一个>).值得注意的是,定理3在任何方面都不涉及逻辑——WeisfeilerLehman算法是一个纯粹的组合算法——然而我们对定理的证明很大程度上依赖于逻辑。
我要感谢Martín Abadi、Dieter van Melkebeek、Moshe Vardi和Thomas Wilke对本文早期版本的非常有帮助的评论。
1.蔡俊,Fürer, M., Immerman .图识别变量数量的最优下界。<我>Combinatorica 12我>(1992), 389410。
2.Chandra, A, Harel, D.关系查询的结构和复杂性。<我>J第一版。系统。科学。我>, 25(1982), 99128。
3.广义一阶谱和多项式时间可识别集。在<我>计算的复杂性,SIAMAMS论文集我>R. M.卡普,第7卷,1974年版,4373。
4.确定固定属图同构的多项式时间算法。在<我>第十二届ACM计算理论研讨会论文集我>, 1980, 236243。
5.平面图形上的不动点逻辑。在<我>第十三届IEEE计算机科学逻辑学研讨会论文集我>, 1998, 615。
6.高哲,Mariño, J.有界树宽度数据库的可定义性和描述复杂性。在<我>第七届数据库理论国际会议论文集,计算机科学课堂讲稿我>卷,1540年。C.贝里和P.布尼曼,编。斯普林格-弗拉格,耶路撒冷,以色列,1999,7082。
7.逻辑与计算机科学的挑战。在<我>理论计算机科学的当前趋势我>.E. Börger,编。计算机科学出版社,1988,157。
8.Hella, L., Kolaitis, P., Luosto, K.在有限模型理论中几乎处处等价逻辑。<我>公牛。的象征。逻辑,2我>(1996), 422443。
9.王晓明,王晓明。平面图同构的线性时间算法。在<我>第六届ACM计算理论研讨会论文集我>, 1974, 172184。
10.可在多项式时间内计算的关系查询(扩展摘要)。在<我>第十四届ACM计算理论研讨会论文集我>, 1982, 147152。
11.作为复杂性度量的可表达性:结果和方向。在<我>第二届IEEE复杂性理论结构研讨会论文集我>, 1987, 194202。
12.描述图:图封圣的一阶方法。在<我>复杂性理论回顾我>.A.塞尔曼主编。斯普林格-弗拉格,海德堡,1990年,5981。
13.在区间图上捕捉多项式时间。在<我>第25届IEEE计算机科学逻辑学研讨会论文集我>, 2010, 199208。
14.有界价图的同构性可以在多项式时间内得到检验。<我>j .第一版。系统。科学。, 25我>(1982), 4265。
15.可枚举集是透变的。<我>位。数学。Dokl。, 11我>(1970), 345357。
16.有界属图的同构检验。在<我>第十二届ACM计算理论研讨会论文集我>, 1980, 225235。
17.奥托,M。<我>有限变量逻辑与计数有限模型的研究,逻辑课堂讲稿我>9卷。斯普林格出版社,柏林,1997年版。
18.对于收缩不变的图的类的同构问题。<我>杀死。Nauchn。扫描电镜。列宁格勒。Otdel。垫。本月,不欢而散。(食物),174年我>(Teor。Slozhn。Vychisl. 3):147177, 182, 1988(俄文)。
19.罗伯逊(N. Robertson),西摩(Seymour), P.图形未成年人IXXIII。出现在<我>j . Combin。Ser的理论。B我>自1982年以来。
20.罗伯逊(N. Robertson),西摩(P. Graph minor XVI)。不包括非平面图形的。<我>j . Combin。Ser的理论。B, 77我>(1999), 127。
21.罗伯逊,N.西摩,P.图未成年人XX。瓦格纳的猜想。<我>j . Combin。Ser的理论。B, 92我>(2004), 325357。
这篇论文的原始版本题为“不含余项图上的不动点可定义性和多项式时间”,发表于<我>第25届IEEE计算机科学逻辑学研讨会论文集我>, 2010年。
DOI:<一个href="http://doi.acm.org/10.1145/1953122.1953150">http://doi.acm.org/10.1145/1953122.1953150一个>
图1。图的三个不同的邻接矩阵和对应的字符串编码(参见例2)。
图2。(c)中的图是(a)中的图的次数,该次数是通过删除(b)中的所有蓝边和顶点并收缩(b)中的所有红边得到的。
©2011 acm 0001-0782/11/0600 $10.00
允许为个人或课堂使用部分或全部作品制作数字或硬拷贝,但不得为盈利或商业利益而复制或分发,且副本在首页上附有本通知和完整的引用。除ACM外,本作品的其他组件的版权必须受到尊重。允许有信用的文摘。以其他方式复制、重新发布、在服务器上发布或重新分发到列表,都需要事先获得特定的许可和/或费用。请求发布的权限<一个href="mailto:permissions@acm.org">permissions@acm.org一个>传真(212)869-0481。
数字图书馆是由计算机协会出版的。版权所有©2011 ACM, Inc.
没有发现记录