Python 默认是没有 goto 语句的,但是有一个第三方库支持在 Python 里面实现类似于
https://github.com/snoack/pyt...
比如在下面这个例子里,
from goto import with_goto @with_goto def func(): for i in range(2): for j in range(2): goto .end label .end return (i, j, k)
func()
for j in range(2)
return
按理说本文到此就该完了,但是这个库有一个限制,如果嵌套的循环层次太深,就无法工作
。比如下面这几行代码:
@with_goto def func(): for i in range(2): for j in range(2): for k in range(2): for m in range(2): for n in range(2): goto .end label .end return (i, j, k, m, n)
SyntaxError
本文接下来的内容,就是如何打破这个限制。
python-goto 是如何工作的
python-goto
func
__code__
goto.py
func
import dis dis.dis(func)
打印出来。
@with_goto
# for i in range(2): # 7 是源代码行号(跟示例不太对得上,不要太在意细节XD) # 0/2/4 这些是 offset,在这里每条字节码长度都是 2。 # >> 表示会跳到这里。 7 0 SETUP_LOOP 40 (to 42) 2 LOAD_GLOBAL 0 (range) 4 LOAD_CONST 1 (2) 6 CALL_FUNCTION 1 8 GET_ITER >> 10 FOR_ITER 28 (to 40) 12 STORE_FAST 0 (i) # for j in range(2): 8 14 SETUP_LOOP 22 (to 38) 16 LOAD_GLOBAL 0 (range) 18 LOAD_CONST 1 (2) 20 CALL_FUNCTION 1 22 GET_ITER >> 24 FOR_ITER 10 (to 36) 26 STORE_FAST 1 (j) # goto .end 9 28 LOAD_GLOBAL 1 (goto) 30 LOAD_ATTR 2 (end) 32 POP_TOP # 结束循环 j 34 JUMP_ABSOLUTE 24 >> 36 POP_BLOCK # 结束循环 i >> 38 JUMP_ABSOLUTE 10 >> 40 POP_BLOCK # label .end 10 >> 42 LOAD_GLOBAL 3 (label) 44 LOAD_ATTR 2 (end) 46 POP_TOP # return (i, j, k) 11 48 LOAD_FAST 0 (i) 50 LOAD_FAST 1 (j) 52 LOAD_GLOBAL 4 (k) 54 BUILD_TUPLE 3
@with_goto
# goto .end - 9 28 LOAD_GLOBAL 1 (goto) - 30 LOAD_ATTR 2 (end) - 32 POP_TOP + 9 28 POP_BLOCK + 30 POP_BLOCK + 32 JUMP_FORWARD 14 (to 48)
# label .end - 10 >> 42 LOAD_GLOBAL 3 (label) - 44 LOAD_ATTR 2 (end) - 46 POP_TOP + 10 >> 42 NOP + 44 NOP + 46 NOP - 11 48 LOAD_FAST 0 (i) + 11 >> 48 LOAD_FAST 0 (i)
@with_goto
goto .end
goto.end
goto
end
LOAD_GLOBAL
LOAD_ATTR
POP_TOP
@with_goto
。这样在执行到这些字节码时,就会跳到指定的地方了,比如在上面例子中跳到 offset 48
label .end
dis
注意它不是按字母表顺序介绍每个字节码的,所以要想查特定的字节码,需要 Ctrl+F 一下。)
JUMP_FORWARD
JUMP_ABSOLUTE
POP_BLOCK
POP_BLOCK
POP_BLOCK
另外,由于 Python 字节码的长度固定为两个 byte,一个 byte 用于表示字节码的类型,
EXTENDED_ARG
语句。比如
EXTENDED_ARG 7 EXTENDED_ARG 2046 OP x
那么语句 OP 的参数就是 7 << 16 + 2046 << 8 + x。
JUMP_FORWARD
EXTENDED_ARG
JUMP_ABSOLUTE
的参数是绝对地址。
goto
python-goto
大小,会抛出 SyntaxError。
在 Python 3.6 之前,不带参数的语句只需要 1 个字节,同样 6 个字节的地方,可以
POP_BLOCK
goto
POP_BLOCK
三层循环都 hold 不住了,这个问题就显得尖锐起来。上面还没考虑到需要加
EXTENDED_ARG
如何绕过字节码大小的限制
那么一个显而易见的解决方案就浮出水面了:为何不试试在修改字节码的时候,动态改变字
节码的大小,让它有足够的位置容纳新增的辅助语句?这样一来,就能彻底地解决问题了。
这个就是开头说到的,打破限制的方法。
__code__
里许多字节码依赖特定的位置或者偏移。如果我们挪动了涉及的字节码,需要同步修改这些
JUMP_ABSOLUTE
JUMP_FORWARD
这个听起来简单,似乎只要把参数 patch 成实际修改后的值就好了。然而 Python 是
EXTENDED_ARG
EXTENDED_ARG
EXTENDED_ARG
while True
EXTENDED_ARG
EXTENDED_ARG
EXTENDED_ARG
EXTENDED_ARG
多。
虽然说起来好像就那么两三段话的事,但是开发难度会很大。因为需要 patch 的字节码类型很多,
大约十来种吧。而且逻辑上较为复杂,牵连的地方很多。实际上我没有实现前述的方案,只是设计了
下而已。如果你要实现它,请在编码时保持内心的平静,另外多写测试用例,不然很容易出问题。