一. 什么是Lambda 'PWA
所谓Lambda,简单的说就是快速的小函数生成。 +`uNO<$~f
在C++中,STL的很多算法都要求使用者提供一个函数对象。例如for_each函数,会要求用户提供一个表明“行为”的函数对象。以vector<bool>为例,如果想使用for_each对其中的各元素全部赋值为true,一般需要这么一个函数对象, yf/i)
P~s u]+
D.gD4g_O/
{%c&T S@s
class filler -quJX;~
{ 2@Oz _?O=
public : J;'H],w}f
void operator ()( bool & i) const {i = true ;} c&C*'c-r
} ; 2d&]V]:R*
fNz(z\
-^q;e]+J
这样实现不但麻烦,而且不直观。而如果使用lambda,则允许用户使用一种直观和见解的方式来处理这个问题。以boost.lambda为例,刚才的问题可以这么解决: gFl@A}
@D>qo=KPM
I>{o]^xw-D
U7HfDDh
for_each(v.begin(), v.end(), _1 = true ); +QP(ATdM
oSIP{lfp2Q
IZs&7
那么下面,就让我们来实现一个lambda库。 J vq)%t8q>
q7<=1r+
JJ9R,
8n6
opTH6a
二. 战前分析 WjOP2CVv|
首先要说明的是,我并没有读过boost.lambda或其他任何lambda库的代码,因此如代码有雷同,纯属巧合。 $$i
Gs6az
开始实现以前,首先要分析出大致的实现手法。先让我们来看几段使用Lambda的代码 #n]K$k>
oxL)Jx\c9A
[}yPy))A
for_each(v.begin(), v.end(), _1 = 1 ); j8c5_&
/* --------------------------------------------- */ }{)Rnb@
>
vector < int *> vp( 10 ); nDyA][
transform(v.begin(), v.end(), vp.begin(), & _1); 6j95>} @
/* --------------------------------------------- */ '}IGV`c
sort(vp.begin(), vp.end(), * _1 > * _2); 6-FM<@H{
/* --------------------------------------------- */ RK=Pm7L:`y
int b = * find_if(v.begin, v.end(), _1 >= 3 && _1 < 5 ); Iw?*y.z|
/* --------------------------------------------- */ Q]e]\J
for_each(vp.begin(), vp.end(), cout << * _1 << ' \n ' ); @km4qJZ
/* --------------------------------------------- */ e$/y~!
for_each(vp.begin(), vp.end(), cout << constant( ' \n ' ) << * _1); kU,g=+2J
>>|47ps3
kW0ctGFYlf
n|Ts:>`V
看了之后,我们可以思考一些问题: }QBL{\E!
1._1, _2是什么? Xk\IO0GF
显然_1和_2都满足C++对于标识符的要求,可见_1和_2都是对象。 =J|jCK[r
2._1 = 1是在做什么? BS(jC
既然_1是一个对象,那么_1的类必然重载了operator=(int)。那么operator=返回什么呢?该函数所返回的对象被传入for_each的第3个参数,可见其返回了一个函数对象。现在整个流程就很清楚了。_1 = 1调用了operator=,其返回了一个函数对象,该函数对象能够将参数1赋值为1。 \Foo:jON
Ok,回答了这两个问题之后,我们的思路就很清晰了。如果要实现operator=,那么至少要实现2个类,一个用于产生_1的对象,另一个用于代表operator=返回的函数对象。 m^
Epw4eg
(4?^X
xT(0-o*
三. 动工 e+)y6Q=
首先实现一个能够范型的进行赋值的函数对象类: rgDl%X2B
g#`}HuPoE
_>ZC;+c?
suE8"v!sk
template < typename T > wY ??#pS
class assignment uQ|LkL%<^
{ 4ETHaIiWp
T value; TU':Rt
public : {{?MO{Mh*
assignment( const T & v) : value(v) {} |=07n K2
template < typename T2 > bR,Es~n
T2 & operator ()(T2 & rhs) const { return rhs = value; } \iaZV.#f
} ; A@9\Qd
<v/aquLN
:,fT^izew
其中operator()被声明为模版函数以支持不同类型之间的赋值。 Zu2`IzrG#
然后我们就可以书写_1的类来返回assignment JY@bD:
vG7Mk8mIr
1rs.
:!hO9ho
class holder g
rCQ#3K*?
{ ~`="tzr:
public : -<9Qez)y
template < typename T > {~w( pAx
assignment < T > operator = ( const T & t) const V^4v`}Wgx
{
;u[:J
return assignment < T > (t); #!E`%'
s]
} nCQ".G
} ; E0/>E
#-PMREgO
|?ZU8I^vW
由于该类是一个空类,因此我们可以在其后放心大胆的写上: (>E/C^Tc%
#d*0
)w
static holder _1; TGU7o:2
Ok,现在一个最简单的lambda就完工了。你可以写 LT>_Y`5>
[VqiF~o,
for_each(v.begin(), v.end(), _1 = 1 ); Wp+lI1t
而不用手动写一个函数对象。 @$!6u0x
O2?yI8|Jn
EZ:?
(|h
x2a
?ugQ
四. 问题分析 S=lCzL;j"
虽然基本上一个Lambda已经初步实现出来了,但是仔细想想,问题也是很多的。 wVFa51a)yy
1, 我们现在是把_1和functor看成两个不同的存在,会导致代码的重复。 ZZZ`@pXm;
2, 目前这个Lambda还无法实现如_1 = 2 = 3这样的链式操作。 Pksr9"Ah
3, 我们没有设计好如何处理多个参数的functor。 ! L|l(<C
下面我们可以对这几个问题进行分析。 e$_gOwB
otfmM]f
五. 问题1:一致性 ](v,2(}=
首先来看看1,合并_1和functor的最佳方法就是把_1本身也变成functor。那么_1的operator()会做什么事情呢?| ah
f,- ?S
很明显,_1的operator()仅仅应该返回传进来的参数本身。 kZo#Ny
w\0vP
struct holder H }]Zp
{ H C,5j)1
// 1h(IrV5 g
template < typename T > oV;sd5'LG
T & operator ()( const T & r) const uD?RL~M
{ \At~94
return (T & )r; .ahY 1CO
} >N 2kWSa
} ; ^;h\#S[%
#pgD-0_
这样的话assignment也必须相应改动: .P7q)lj36h
'
`c \Dq
template < typename Left, typename Right > f3qR7%X?
class assignment Er|&4-9
{ &bfM`h'
Left l; 9H;Os:"\|
Right r; }yn%_KQ0
public : gK;dfrU.8Y
assignment( const Left & l, const Right & r) : l(l), r(r) {} qoH:_o8ClO
template < typename T2 > {5D%<Te
T2 & operator ()(T2 & rhs) const { return l(rhs) = r; } YpXd5;'
} ; ky]^N)
k{lo'
同时,holder的operator=也需要改动: w'A *EWO
>yLDU_P)
template < typename T > rir,|y,
assignment < holder, T > operator = ( const T & t) const $xdo=4;|
{ pfIK9>i
return assignment < holder, T > ( * this , t); xzOvc<u
} A'7Y{oPHX
$H.U ~
好,这样holder也成为了一个functor,这为我们以后添加功能节省了很多代码。 WRkuPj2
你可能也注意到,常数和functor地位也不平等。 W( sit;O
:h(3Ep
return l(rhs) = r; Ix,b -C~
在这一句中,r没有调用operator()而l调用了。这样以后就要不时的区分常数和functor,是不良的设计。 N0}[&rE 8
那么我们仿造holder的做法实现一个常数类: s.rQiD
xzA!,75@U
template < typename Tp > #o[n.
class constant_t xu"-Uj1
{ ,1B4FAR&
const Tp t; S
LeA,T
public : Q?LzL(OioN
constant_t( const Tp & t) : t(t) {} 7VZ ^J`3
template < typename T > Z.Z31yF:f
const Tp & operator ()( const T & r) const +mD;\iW]
{ ~,};FI
return t; yK"\~t[@X:
} \'u+iB
g
} ; [.Md_
bZgo}`o%
该functor的operator()无视参数,直接返回内部所存储的常数。 L\"wz scn
下面就可以修改holder的operator=了 zVtTv-DU
EZ/_uj2&SN
template < typename T > 4clCZ@\K^
assignment < holder, constant_t < T > > operator = ( const T & t) const J Q*~le*
{ F=5vAv1
return assignment < holder, constant_t < T > > ( * this , constant_t < T > (t)); g\/|7:yB]
} CdCY#$Z
1I'}Uh*
同时也要修改assignment的operator() GHLnwym
% rnRy<9
template < typename T2 > YqXN|&
T2 & operator ()(T2 & rhs) const { return l(rhs) = r(rhs); } }j1;0 kb?
现在代码看起来就很一致了。 4IB`7QJq
9;vES^
六. 问题2:链式操作 SJO*g&duQ
现在让我们来看看如何处理链式操作。 z=>P jIW
其实问题1已经为我们处理掉了大量的问题。如果_1,functor,常量彼此之间不统一为functor,那么链式操作的时候就要时刻小心一个对象是_1还是functor还是常量,会大大增加编码的难度。 7^Us
事实上,首先要解决的是,如何知道一个functor的operator()的返回值的类型。遗憾的是,我并没有找到非常自动的办法,因此我们得让functor自己来告诉我们返回值的类型。 @>~S$nw/
比较麻烦的是,operator()的返回值一般和其参数的类型相关,而operator()通常是一个模版函数,因此其返回值类型并不能用一个简单的typedef来指定,而必须实现一个trait。 UHi^7jQ
现在我们在assignment内部声明一个nested-struct P|?nx"c
WdC7CK
template < typename T > f>mEX='w
struct result_1 oa7 N6
{ 5syzh
S
typedef typename ref < typename Left::result_1 < T > ::result > ::reference result; imwn)]L R
} ; cdH`#X
-gC%*S5&
那么如果参数为T,其返回值类型就为result_1<T>::result。上面代码的ref<T>为一个类型转换类,作用是返回T的引用。不直接加上&符号的原因是如果T本身就是Q的引用Q&,那么Q&&是非法的。因此ref的实现即为: H3d|eO4+W
uQW[2f
template < typename T > x~8R.Sg
struct ref <?8cVLW}O
{ wod{C !
typedef T & reference; )PU\|I0|)e
} ; gGA5xkA
template < typename T > 6rG7/
struct ref < T &> U:MZN[Cc[
{ Ue,eEer
typedef T & reference; 23p.g5hJi
} ; 5HL>2
e[
=yqg,w&Q
有了result_1之后,就可以把operator()改写一下: jamai8
rc%*g3ryLG
template < typename T > u|EJ)dT?
typename result_1 < T > ::result operator ()( const T & t) const E6G;fPd= E
{ $1)NYsSH/H
return l(t) = r(t); Sqmjf@o$>
} /Z#AHfKF
可能大家已经注意到我定义assignment的operator()的返回类型的时候,是直接将其定义为Left的operator()返回类型的引用形式,如果实际上处理的对象的operator=并不是按照常理来声明的,那么这段代码可能就编译不过。这的确是一个很麻烦的事情。实际上,在gcc下,使用typeof关键字可以很容易的得到该类型的operator=的返回类型,就可以让这段代码变得更有通用性。然而为了实现可移植性,我不得不放弃这个诱人的想法。 93w$ck},?G
同理我们可以给constant_t和holder加上这个result_1。 e*Nm[*@UW
MfLus40;n
有了这个result_1,链式操作就简单多了。现在唯一要做的事情就是让所有的functor都重载各种操作符以产生新的functor。假设我们有add和divide两个类,那么 l{ fL~O
_1 / 3 + 5会出现的构造方式是: EOqV5$+
_1 / 3调用holder的operator/ 返回一个divide的对象
ji ,`?
+5 调用divide的对象返回一个add对象。 >2mY%
最后的布局是: /n,a0U/
Add CSm(yB{|pC
/ \ \4 t;{_
Divide 5 JL:B4f%}B
/ \ Xe/7rhov
_1 3 95D(0qv
似乎一切都解决了?不。 x5U;i
你可以想象一下一个完整的Lambda库,它必然能够重载C++几乎所有的操作符。假设其重载了10个操作符,那么至少会有10个代表这些操作符的functor类。大体上来讲,每一种操作符所对应的functor都应当能够由链式操作产生别的任意一种操作符所对应的functor。(例如:*_1 = 2既是由operator*的functor产生operator=的functor)。可想而知这样一共能产生10*10=100种产生方式。这是对编码的一个大挑战。 d]=>U^K
如何简化这个问题呢?我们不妨假定,任意一种操作符的functor,都能够产生任意一种操作符的functor,这样,每一种操作符的functor都拥有一样的产生方案。如果某种转换确实是不合法的(例如:A/B=C无论如何也不可能合法),那么在试图产生新functor的时候会出现编译错误。幸好C++的模版是如果不使用就不编译的,因此这种编译错误不会干扰到正常的使用,这正是我们所要的。 #&{)`+!"
OK,我们的方法呼之欲出了。既然所有的functor都具有一样的产生方案,那么不如大家都不要实现,等到最后统一的在所有的functor里面加上这么一系列的产生代码吧。例如,如果要添加从某functor XXX到operator=的functor的产生代码: u6\W"LW
\vj xCkg{
template < typename Right > s\3ZE11L
assignment < XXX, typename picker_maker < Right > ::result > operator = ( const P8CIKoKCV
Right & rt) const hE2{m{^A
{ =*y{y)B^g
return assignment < XXX, typename picker_maker < Right > ::result > ( * this , rt); !a5e{QG0
} 9@Z++J.^y
下面对该代码的一些细节方面作一些解释 i~HS"n
XXX指的是原来的functor的类型,picker_maker<T>是一个类型变换的trait,如果T是一个常量,那么他会返回constant_t<T>,否则返回T本身。 m Ub2U&6(
因此如果该函数声明在assignment的内部,那么就实现了连等,如果声明在的dereference(解引用)的内部,就允许(*A = B)的行为发生。 [vdC $9z,
最后,如何把这些函数塞到各个functor的声明里边呢?当然可以用宏,但是。。。大家都知道这样不好。 q> #P|
除了宏之外还可以用的方式就是继承。我们可以写一个类叫做picker,该类实现了所有的如上的产生函数。然后让所有的functor继承自它。 D{[i_K
且慢,也许立刻就有人跳出来说:这样的话那个XXX怎么写呢?这样不是会导致循环依赖么?这样不是会有downcast么? Pc~)4>X<
正解,让picker做基类确实不是一个好主意。反过来,让picker继承functor却是一个不错的方法。下面是picker的声明: ;]/cCi
yAel4b/}
template < class Action > 1&kf