php生成器提供了一种更容易的方法来实现简单的对象迭代,相比较定义类实现 Iterator 接口的方式,性能开销和复杂性大大降低。
这个功能是在php 5.5.0版本才推出,以至于被许多人忽略了。我本人也是在下决心巩固编程基础知识的时候翻看php官方手册才发现的。
生成器允许你在 foreach 代码块中写代码来迭代一组数据而不需要在内存中创建一个数组, 那会使你的内存达到上限,或者会占据可观的处理时间。相反,你可以写一个生成器函数,就像一个普通的自定义函数一样, 和普通函数只返回一次不同的是, 生成器可以根据需要 yield 多次,以便生成需要迭代的值。
一个简单的例子就是使用生成器来重新实现 range() 函数。 标准的 range() 函数需要在内存中生成一个数组包含每一个在它范围内的值,然后返回该数组, 结果就是会产生多个很大的数组。 比如,调用 range(0, 1000000) 将导致内存占用超过 100 MB。
如果使用生成器, 只需要足够的内存来创建 Iterator 对象并在内部跟踪生成器的当前状态,这样只需要不到1K字节的内存。
直接讲概念估计你听完还是一头雾水,所以我们先来说说优点,也许能勾起你的兴趣。那么生成器有哪些优点,如下:
生成器会对PHP应用的性能有非常大的影响
PHP代码运行时节省大量的内存
比较适合计算大量的数据
那么,这些神奇的功能究竟是如何做到的?
以上例子中用foreach循环处理了getLines("file.txt")这个函数的返回值。
我们先不管getLines("file.txt")返回值是什么,我们先来看foreach的用法,以下是php官方的原话:
foreach语法结构提供了遍历数组的简单方式。foreach 仅能够应用于数组和对象,如果尝试应用于其他数据类型的变量,或者未初始化的变量将发出错误信息。
由此可见getLines("file.txt")返回的是一个数组或者对象。
现在再回头看getLines函数的代码。这是一个没有返回值的函数,而其中你发现有一个平时不怎么用的关键字“yield”。
在上面的例子中,我们把getLines("file.txt")看作一个生成器,而foreach在迭代生成器函数的时候,实际是在迭代getLines("file.txt")返回的一个 Generator 类的对象。而这个对象不同于我们常见的对象,他在被调用的时候会根据调用它的循环次数依次返回其内部可以生成的数据,直到最后一个yield产出值或者调用它的循环终止,使用的 Generator返回值始终只占用了一次返回值所需要的内存。
生成器yield关键字不是返回值,他的专业术语叫产出值,只是生成一个值。
生成器函数可以被调用的产出值的个数有多少个,就看生成器函数完整执行一共会有多少个yield产生,在实际应用中我们调用生成器函数进行循环处理的代码跟操作数组没有区别。而php生成器本身就是为了避免在特殊场景中生成的数组或者对象过于庞大占用大量内存设置内存溢出。
以下是php官网中对Generator的释义,本人翻译水平有限请包涵。
When a generator function is called for the first time, an object of the internal Generator class is returned. This object implements the Iterator interface in much the same way as a forward-only iterator object would, and provides methods that can be called to manipulate the state of the generator, including sending values to and returning values from it.首次调用生成器函数时,返回一个生成器类的对象。这个对象实现迭代器接口并以相同的方式作为一个单向迭代器对象。并提供了方法,可以操纵生成器的状态,包括发送值和返回值。
生成器在实际开发中有哪些应用?根据其特性,其可在循环中被调用,而被调用后会根据被调用的次数返回其
PHP开发很多时候都要读取大文件,比如csv文件、text文件,或者一些日志文件。这些文件如果很大,比如5个G。这时,直接一次性把所有的内容读取到内存中计算不太现实。
这里生成器就可以派上用场啦。简单看个例子:读取text文件。
我写自媒体一个主要原因是赚银子养家糊口,而另一个原因是为了重新理解编程,理解php,理解开发。写过一遍知识就自然而然的就装到脑子里了,对记忆很有帮助,各位朋友不妨参与到讨论中,在讨论中加深记忆。
留言与评论(共有 0 条评论) |