用于层间视频解码和编码设备和方法的对深度图像的场景内预测方法_5

文档序号：9794463阅读：来源：国知局

实施例的视频编码设备800或根据一些示例性实施例的视频解码设备900针对每个最大编码单元，根据具有小于或等于最大编码单元的尺寸的编码单元对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择用于在编码期间进行变换的变换单元的尺寸。
[0334] 例如，在根据一些示例性实施例的视频编码设备800或根据一些示例性实施例的视频解码设备900中，如果编码单元1410的尺寸是64 X 64，则可通过使用尺寸为32 X 32的变换单元1420来执行变换。
[0335] 此外，可通过对小于64 X 64的尺寸为32 X 32、16 X 16、8 X 8和4 X 4的变换单元中的每一个执行变换，来对尺寸为64 X 64的编码单元1410的数据进行编码，然后可选择具有最小编码误差的变换单元。
[0336] 图15是用于描述根据一些示例性实施例的编码信息的示图。
[0337] 根据一些示例性实施例的视频编码设备800的输出单元830可对与深度相应的每个编码单元的关于分区模式的信息1500、关于预测模式的信息1510W及关于变换单元的尺寸的信息1520进行编码，并将信息1500、信息1510W及信息1520作为划分信息来发送。
[0338] 信息1500指示关于通过划分当前编码单元的预测单元而获取的分区的形状的信息，其中，分区是用于对当前编码单元进行预测编码的数据单元。例如，可将尺寸为2NX2N 的当前编码单元CU_0划分成W下分区中的任意一个:尺寸为2NX2N的分区1502、尺寸为2N XN的分区1504、尺寸为NX 2N的分区1506和尺寸为NXN的分区1508。运里，关于分区类型的信息1500被设置为指示W下分区之一:尺寸为2NXN的分区1504、尺寸为NX2N的分区1506 和尺寸为NXN的分区1508。
[0339] 信息1510指示每个分区的预测模式。例如，信息1510可指示对由信息1500指示的分区执行的预测编码的模式，即，帖内模式1512、帖间模式1514或跳过模式1516。
[0340] 信息1520指示当对当前编码单元执行变换时所基于的变换单元。例如，变换单元可W是第一帖内变换单元1522、第二帖内变换单元1524、第一帖间变换单元1526或第二帖间变换单元1528。
[CX341]根据一些示例性实施例的视频解码设备900的图像数据和编码信息提取器1610可根据每个较深层编码单元，提取并使用用于解码的信息1500、信息1510和信息1520。
[0342] 图16是根据一些示例性实施例的根据深度的较深层编码单元的示图。
[0343] 划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
[0344] 用于对深度为0且尺寸为2N_0 X 2N_0的编码单元1600进行预测编码的预测单元 1610可包括W下分区模式的分区:尺寸为2N_0X2N_0的分区模式1612、尺寸为2N_0XN_0的分区模式1614、尺寸为N_0X2N_0的分区模式1616和尺寸为N_0XN_0的分区模式1618。图16 仅示出了通过对称地划分预测单元而获取的分区1612至1618,但是分区模式不限于此，并且预测单元的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
[0345] 根据每种分区模式，对尺寸为2N_0 X 2N_0的一个分区、尺寸为2N_0 XN_0的两个分区、尺寸为N_0 X 2N_0的两个分区和尺寸为N_0 XN_0的四个分区重复地执行预测编码。可对尺寸为2N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分区执行帖内模式和帖间模式下的预测编码。仅对尺寸为2N_0 X 2N_0的分区执行跳过模式下的预测编码。
[0346] 如果在分区模式1612至1616中的一个分区模式中编码误差最小，则可不将预测单元1610划分到更低深度。
[0347] 如果在分区模式1618中编码误差最小，则深度从0改变到IW在操作1620中对分区模式1618进行划分，并对深度为2且尺寸为N_0XN_0的编码单元1630重复地执行编码来捜索最小编码误差。
[(X34引用于对深度为1且尺寸为2N_1X2N_1(=N_0XN_0)的编码单元1630进行预测编码的预测单元1640可包括W下分区模式的分区：尺寸为2N_1X2N_1的分区模式1642、尺寸为 2N_1XN_1的分区模式1644、尺寸为N_1X2N_1的分区模式1646W及尺寸为N_1XN_1的分区模式1648。
[0349] 如果在分区模式1648中编码误差最小，则深度从1改变到2W在操作1650中对分区模式1648进行划分，并对深度为2且尺寸为N_2XN_2的编码单元1660重复执行编码来捜索最小编码误差。
[0350] 当最大深度是加寸，根据每个深度的划分操作可被执行直到深度变成d-1时，并且划分信息可被编码直到深度是0到d-2之一时。换句话说，当编码被执行直到在与d-2的深度相应的编码单元在操作1670中被划分之后深度是d-1时，用于对深度为d-1且尺寸为2N_(d-l)X2N_(d-l)的编码单元1680进行预测编码的预测单元1690可包括W下分区模式的分区：尺寸为2N_(d-l) X2N_(d-l)的分区模式1692、尺寸为2N_(d-l) XNJd-I)的分区模式1694、尺寸为NJd-I) X 2N_(d-1)的分区模式1696和尺寸为NJd-I) X NJd-I)的分区模式1698。
[0351] 可对分区模式中的尺寸为2N_(d-l)X2N_(d-l)的一个分区、尺寸为2N_(d-l)XN_ (d-1)的两个分区、尺寸为NJd-I) X 2N_(d-l)的两个分区、尺寸为NJd-I) XNJd-I)的四个分区重复地执行预测编码，W捜索具有最小编码误差的分区模式。
[0352] 即使当分区模式1698具有最小编码误差时，由于最大深度是d，因此深度为d-1的编码单元CU_(d-l)不再被划分到更低深度，用于构成当前最大编码单元1600的编码单元的深度被确定为d-1，并且当前最大编码单元1600的分区模式可被确定为NJd-I) XN_(d-l)。此外，由于最大深度是d，因此不设置针对深度为d-1的编码单元1652的划分信息。
[0353] 数据单元1699可W是用于当前最大编码单元的"最小单元"。根据一些示例性实施例的最小单元可W是通过将具有最低深度的最小编码单元划分成4份而获取的正方形数据单元。通过重复地执行编码，根据一些示例性实施例的视频编码设备800可通过比较根据编码单元1600的深度的编码误差来选择具有最小编码误差的深度W确定深度，并将相应分区模式和预测模式设置为该深度的编码模式。
[0354] 运样，在所有深度1至d中对根据深度的最小编码误差进行比较，并且具有最小编码误差的深度可被确定为d深度。深度、预测单元的分区模式和预测模式可作为划分信息被编码并被发送。另外，由于编码单元从深度0被划分到深度，因此仅将深度的划分信息设置为0,并且将除了该深度W外的深度的划分信息设置为1。
[03W]根据一些示例性实施例的视频解码设备900的图像数据和编码信息提取器920可提取并使用关于编码单元1600的深度和预测单元的信息，W对分区1612进行解码。根据一些示例性实施例的视频解码设备200可通过使用根据深度的划分信息，将划分信息为0的深度确定为深度，并且使用相应深度的划分信息来进行解码。
[0356] 图17至图19是用于描述根据一些示例性实施例的在编码单元、预测单元和变换单元之间的关系的示图。
[0357] 编码单元1710是最大编码单元中的根据由根据一些示例性实施例的视频编码设备800确定的深度的具有树结构的编码单元。预测单元1760是根据深度的每个编码单元的预测单元的分区，变换单元1770是根据深度的每个编码单元的变换单元。
[0358] 当在编码单元1710中最大编码单元的深度是0时，编码单元1712和1754的深度是 1，编码单元 1714、1716、1718、1728、1750 和 1752 的深度是 2,编码单元 1720、1722、1724、 1726、1730、1732和1748的深度是3,编码单元1740、1742、1744和1746的深度是4。
[0359] 在预测单元1760中，通过划分编码单元1710中的编码单元来获取一些编码单元 1714、1716、1722、1732、1748、1750、1752 和 1754。换句话说，编码单元 1714、1722、1750 和 1754中的分区模式的尺寸是2NXN，编码单元1716、1748和1752中的分区模式的尺寸是NX 2N，编码单元1732的分区模式的尺寸为NXN。编码单元1710的预测单元和分区小于或等于每个编码单元。
[0360] 在小于编码单元1752的数据单元中的变换单元1770中，对编码单元1752的图像数据执行变换或逆变换。另外，在尺寸和形状方面，变换单元1770中的编码单元1714、1716、 1722、1732、1748、1750 和 1752 不同于预测单元 1760 中的编码单元 1714、1716、1722、1732、 1748、1750和1752。换句话说，根据一些示例性实施例的视频编码设备800和视频解码设备 900可对同一编码单元中的数据单元独立地执行帖内预测、运动估计、运动补偿、变换和逆变换。
[0361] 因此，对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元，从而可获取具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区模式的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表9示出可由根据各种示例性实施例的视频编码设备800和视频解码设备900设置的编码信息。
[0362] [表 2]
[0364] 根据一些示例性实施例的视频编码设备800的输出单元830可输出关于具有树结构的编码单元的编码信息，根据一些示例性实施例的视频解码设备900的图像数据和编码信息提取器920可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
[0365] 划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d 的划分信息是0，则当前编码单元不再被划分成更低深度的深度是深度，从而可针对深度来定义关于分区模式、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分，则对更低深度的四个划分编码单元独立地执行编码。
[0366] 预测模式可W是帖内模式、帖间模式和跳过模式中的一种。可在所有分区模式中定义帖内模式和帖间模式，可仅在尺寸为2NX2N的分区模式中定义跳过模式。
[0367] 关于分区模式的信息可指示通过对称地划分预测单元的高度或宽度而获取的尺寸为2N X 2N、2N X N、N X 2N和N X N的对称分区模式，W及通过非对称地划分预测单元的高度或宽度而获取的尺寸为2NXnU、2NXnD、化X2N和nRX2N的非对称分区模式。可通过按1:3 和3:1来划分预测单元的高度来分别获取尺寸为2NXnU和2NXnD的非对称分区模式，可通过按1:3和3:1来划分预测单元的宽度来分别获取尺寸为化X 2N和nRX 2N的非对称分区模式。
[0368] 可将变换单元的尺寸设置成帖内模式下的两种类型和帖间模式下的两种类型。换句话说，如果变换单元的划分信息是0,则变换单元的尺寸可W为2NX2N，即当前编码单元的尺寸。如果变换单元的划分信息是1，则可通过对当前编码单元进行划分来获取变换单元。另外，如果尺寸为2NX2N的当前编码单元的分区模式是对称分区模式，则变换单元的尺寸可W为NXN，如果当前编码单元的分区类型是非对称分区模式，则变换单元的尺寸可W 是 N/2XN/2。
[0369] 根据一些示例性实施例，关于具有树结构的编码单元的编码信息可包括与深度相应的编码单元、预测单元和最小单元中的至少一个。与深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。
[0370] 因此，通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与深度相应的同一编码单元中。另外，通过使用数据单元的编码信息来确定与深度相应的相应编码单元，并因此可确定最大编码单元中的深度的分布。
[0371] 因此，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
[0372] 可选地，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则使用数据单元的编码信息来捜索与当前编码单元邻近的数据单元，并可参考捜索到的邻近编码单元来对当前编码单元进行预测。
[0373] 图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
[0374] 最大编码单元2000包括多个深度的编码单元2002、2004、2006、2012、2014、2016和 2018。运里，由于编码单元2018是具有深度的编码单元，因此划分信息可被设置成0。可将关于尺寸为2NX2N的编码单元2018的分区模式的信息设置成W下分区模式中的一种:尺寸为 2NX2N的分区模式2022、尺寸为2NXN的分区模式2024、尺寸为NX 2N的分区模式2026、尺寸为NXN的分区模式2028、尺寸为2NXnU的分区模式2032、尺寸为2NXnD的分区模式2034、尺寸为nL X 2N的分区模式2036和尺寸为nR X 2N的分区模式2038。
[0375] 变换单元的划分信息(TU尺寸标志)是一种类型的变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区模式而改变。
[0376] 例如，当分区模式被设置为对称（即，分区模式2022、2024、2026或2028)时，如果变换单元的TU尺寸标志是0，则设置尺寸为2N X 2N的变换单元2042，如果TU尺寸标志是1，则设置尺寸为N X N的变换单元2044。
[0377] 当分区模式被设置成非对称（即，分区模式2032、2034、2036或2038)时，如果TU尺寸标志是0，则设置尺寸为2N X 2N的变换单元2052，如果TU尺寸标志是1，则设置尺寸为N/2 X N/2的变换单元2054。
[0378] 参照图19，TU尺寸标志是具有值0或1的标志，但是根据一些示例性实施例的TU尺寸标志不限于1比特，并且变换单元可在TU尺寸标志从0增加时被分层划分而具有树结构。变换单元的划分信息(TU尺寸标志)可W是变换索引的示例。
[0379] 在运种情况下，可通过使用根据一些示例性实施例的变换单元的TU尺寸标志W及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。根据一些示例性实施例的视频编码设备800能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大 TU尺寸标志进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志进行编码的结果可被插入SPS。根据一些示例性实施例的视频解码设备900可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志来对视频进行解码。
[0380] 例如，（a)如果当前编码单元的尺寸是64 X 64并且最大变换单元尺寸是32 X 32，贝。 (a-1)当TU尺寸标志为加寸，变换单元的尺寸可W是32 X 32，（a-2)当TU尺寸标志为1时，变换单元的尺寸可W是16X 16,（a-3)当TU尺寸标志为2时，变换单元的尺寸可W是8X8。
[0381] 作为另一示例，（b)如果当前编码单元的尺寸是32 X 32并且最小变换单元尺寸是 32X32,则(b-1)当TU尺寸标志为加寸，变换单元的尺寸可W是32X32。运里，由于变换单元的尺寸不能够小于32 X 32，因此TU尺寸标志不能够被设置为除了OW外的值。
[0382] 作为另一示例，（C)如果当前编码单元的尺寸是64X64并且最大TU尺寸标志为1，则TU尺寸标志可W是0或1。运里，TU尺寸标志不能够被设置为除了 0或IW外的值。
[0383] 因此，如果定义最大TU尺寸标志为"MaxTransformSizeIndex"，最小变换单元尺寸为"MinTransformSize"，并且当TU尺寸标志为0时的变换单元尺寸为"RootTuSize"，贝可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸"CurrMinTuSize":
[0384] CurrMinTuSize = max(MinTransformSize,RootTuSize/(2' MaxTransformSizeIndex))
[0385] ---(I)
[0386] 与可在当前编码单元中确定的当前最小变换单元尺寸乂urrMin化Size"相比，当 TU尺寸标志为0时的变换单元尺寸"RootTuSize"可指示可在系统中选择的最大变换单元尺寸。在等式（1)中，"RootTuSize/U'MaxTransformSizeIndex)"指示当TU尺寸标志为0时，变换单元尺寸"RootTuSize"被划分了与最大TU尺寸标志相应的次数时的变换单元尺寸， ''MinTransformSize"指示最小变换尺寸。因此，"RootTuSize/(2 - MaxTransformSizeindex)"和"MinTransformSize"中较小的值可W是可在当前编码单元中确定的当前最小变换单元尺寸"CurrMinTuSize"。
[0387] 根据一些示例性实施例，最大变换单元尺寸Root化Size可根据预测模式的类型而改变。
[0388] 例如，如果当前预测模式是帖间模式，则可通过使用W下的等式（2)来确定 "RootTuSize"。在等式（2)中，"MaxTransformSize"指示最大变换单元尺寸，"PUSize"指示当前预测单元尺寸。
[0389] RootTuSize=min(MaxTransformSize ,PUSize)......(2)
[0390] 也就是说，如果当前预测模式是帖间模式，则当TU尺寸标志为0时的变换单元尺寸 "RootTuSize"可W是最大变换单元尺寸和当前预测单元尺寸中较小的值。
[0391] 如果当前分区单元的预测模式是帖内模式，则可通过使用W下的等式(3)来确定 "RootTuSize"。在等式(3)中，"PartitionSize"指示当前分区单元的尺寸：
[0392] RootTuSize=min(MaxTransformSize ,PartitionSize)......(3)
[0393] 也就是说，如果当前预测模式是帖内模式，则当TU尺寸标志为0时的变换单元尺寸 "RootTuSize"可W是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
[0394] 然而，根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸 "RootTuSize"仅是示例，并且本发明构思不限于此。
[03M]根据W上参照图8至图20描述的基于具有树结构的编码单元的视频编码方法，可针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法，对每个最大编码单元执行解码来重建空间域的图像数据。因此，画面和作为画面序列的视频可被重建。重建的视频可由再现设备来再现，可存储在存储介质中，或可通过网络来发送。
[0396] 根据本发明构思的实施例可被编写为计算机程序，并可实现在使用计算机可读记录介质执行程序的通用数字计算机中。计算机可读记录介质的示例包括磁存储介质(例如， ROM、软盘、硬盘等)和光学记录介质(例如，CD-ROM或DVD)。
[0397] 为便于描述，W上参照图Ia至图20描述的视频编码方法和/或视频编码方法将被统称为"本发明构思的视频编码方法"。另外，W上参照图Ia至图20描述的视频解码方法和/ 或视频解码方法将被称为"本发明构思的视频解码方法"。
[0398] 此外，已参照图Ia至图20描述的包括视频编码设备10、视频编码设备800或图像编码器1100的视频编码设备将被称为"本发明构思的视频编码设备"。另外，已参照图Ia至图 20描述的包括层间视频解码设备20、视频解码设备900或图像解码器1200的视频解码设备将被称为"本发明构思的视频解码设备"。
[0399] 现在将详细描述根据一些示例性实施例的存储程序的计算机可读记录介质（例如，盘26000)。
[0400] 图21是根据一些示例性实施例的存储程序的盘26000的物理结构的示图。作为存储介质的盘26000可W是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘化VD)。盘26000包括多个同屯、磁道Tr,每个同屯、磁道化沿盘26000的圆周方向被划分成特定数量的扇区Se。在根据一些示例性实施例的盘26000的特定区域中，可分配并存储执行W 上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。
[0401] 现在将参照图22来描述使用存储用于执行如上所述的视频编码方法和视频解码方法的程序的存储介质来实现的计算机系统。
[0402] 图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统 27000可经由盘驱动器26800将执行本发明构思的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统27000中运行存储在盘26000中的程序，可通过使用盘驱动器27000从盘26000读取程序并将程序发送到计算机系统26700。
[0403] 执行本发明构思的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图21或图22中示出的盘26000中，还可被存储在存储卡、ROM卡带或固态驱动器(SSD) 中。
[0404] W下将描述应用W上所描述的视频编码方法和视频解码方法的系统。
[040

完整全部详细技术资料下载

当前第5页1 2 3 4 5 6