一. 什么是Lambda EYe)d+E*
所谓Lambda,简单的说就是快速的小函数生成。 >JNK06T
在C++中,STL的很多算法都要求使用者提供一个函数对象。例如for_each函数,会要求用户提供一个表明“行为”的函数对象。以vector<bool>为例,如果想使用for_each对其中的各元素全部赋值为true,一般需要这么一个函数对象, qr5ME/)z
hq5=>p
Ihe/P {t]J
/+FZDRf!r
class filler f z)i9D@
{ Bld%d:i
public : Jk$XL<t
void operator ()( bool & i) const {i = true ;} <Pg]V:=g'
} ; \ 2Jr(?U
(h"Yw
oXCZpS
这样实现不但麻烦,而且不直观。而如果使用lambda,则允许用户使用一种直观和见解的方式来处理这个问题。以boost.lambda为例,刚才的问题可以这么解决: EYwDv4H,g
\u|8MEB
8vN} v3HV&
fO!S^<9,-
for_each(v.begin(), v.end(), _1 = true ); T<p,KqH
B{ i5UhxD
W]8tp@
那么下面,就让我们来实现一个lambda库。 Dxc`K?M
S-FoyID\H
\O]1QM94Y
<K8$00lm
二. 战前分析 ` ,B&oV>
首先要说明的是,我并没有读过boost.lambda或其他任何lambda库的代码,因此如代码有雷同,纯属巧合。 e/;1<5tfj
开始实现以前,首先要分析出大致的实现手法。先让我们来看几段使用Lambda的代码 4o:
8&AHu
8}Pd- .se
for_each(v.begin(), v.end(), _1 = 1 ); fk(l.A$
/* --------------------------------------------- */ 4:!KtpR[O
vector < int *> vp( 10 ); #8N9@
transform(v.begin(), v.end(), vp.begin(), & _1); 3@k;"pFa<
/* --------------------------------------------- */ !Ua74C
sort(vp.begin(), vp.end(), * _1 > * _2); R~-r8dWcw
/* --------------------------------------------- */ G$ l>By
int b = * find_if(v.begin, v.end(), _1 >= 3 && _1 < 5 ); 6B4s6
/* --------------------------------------------- */ vXUrS+~x
for_each(vp.begin(), vp.end(), cout << * _1 << ' \n ' ); XxW~4<r
/* --------------------------------------------- */ (t.pM P4
for_each(vp.begin(), vp.end(), cout << constant( ' \n ' ) << * _1); yFt'<{z[nL
cZ(7/Pl
b;!oPT
}2sc|K^
看了之后,我们可以思考一些问题: 8aCa(Xu(H
1._1, _2是什么? y{Wtm7fnA
显然_1和_2都满足C++对于标识符的要求,可见_1和_2都是对象。 AHws5#;$6*
2._1 = 1是在做什么? G0sg\]
既然_1是一个对象,那么_1的类必然重载了operator=(int)。那么operator=返回什么呢?该函数所返回的对象被传入for_each的第3个参数,可见其返回了一个函数对象。现在整个流程就很清楚了。_1 = 1调用了operator=,其返回了一个函数对象,该函数对象能够将参数1赋值为1。 C[j'0@~V:B
Ok,回答了这两个问题之后,我们的思路就很清晰了。如果要实现operator=,那么至少要实现2个类,一个用于产生_1的对象,另一个用于代表operator=返回的函数对象。 T)o)%Yv
`jR = X
@Q"%a`mKH
三. 动工 &hmyfH&S
首先实现一个能够范型的进行赋值的函数对象类: ~lx5RTkp
C9-90,
S.o@95M
z3IQPl^
template < typename T > H6<\7W89y
class assignment uJ S+;H
{ }r&^*"
2=
T value; A9lnQCsJ
public : T-=sC=sS,
assignment( const T & v) : value(v) {} -I1Ne^DZn4
template < typename T2 > Pnb?NVP!^9
T2 & operator ()(T2 & rhs) const { return rhs = value; } j)Z3m @Ii5
} ; YoD1\a|
(rcH\
Ez^U1KKOE7
其中operator()被声明为模版函数以支持不同类型之间的赋值。 /*Z,i&eC
然后我们就可以书写_1的类来返回assignment saOXbt(&
u1yc
XVi?-/2
X*F#=.lh
class holder ]Mv.Rul?~
{ I71kFtvcy*
public : ]A;zY%>
template < typename T > xz dqE
assignment < T > operator = ( const T & t) const iMnp `:*
{ GXC:~$N
return assignment < T > (t); zJ4 2%0g
} 7Rr(YoWa
} ; C& 0iWY\a
/nEh,<Y)
]}/LNO*L"
由于该类是一个空类,因此我们可以在其后放心大胆的写上: ;o;P2}zD
Mn(:qQo^&`
static holder _1; brN:Ypf-e
Ok,现在一个最简单的lambda就完工了。你可以写 oDp!^G2A"
iARIvhfdi
for_each(v.begin(), v.end(), _1 = 1 ); 7O{c>@\
而不用手动写一个函数对象。 /?l@7
9)p VDS
8W?/Sg`
y\Z7]LHCqw
四. 问题分析 #RK?3?wcr
虽然基本上一个Lambda已经初步实现出来了,但是仔细想想,问题也是很多的。 |+//pGx
1, 我们现在是把_1和functor看成两个不同的存在,会导致代码的重复。 (3C6'Wt
2, 目前这个Lambda还无法实现如_1 = 2 = 3这样的链式操作。 3O<:eS~
3, 我们没有设计好如何处理多个参数的functor。 t?9F2rh
下面我们可以对这几个问题进行分析。 x|l[fdm5
9;u$a^R.
五. 问题1:一致性 )*N]Q
首先来看看1,合并_1和functor的最佳方法就是把_1本身也变成functor。那么_1的operator()会做什么事情呢?| }p0|.Qu 9
很明显,_1的operator()仅仅应该返回传进来的参数本身。 50Z$3T
n~\"W
struct holder BnH<-n_
{ heiIb|z
// d?_Bll"
template < typename T > 5nIm7vlQm
T & operator ()( const T & r) const $L>tV='
{ e!*d(lHKos
return (T & )r; fU_itb(
} [QA@XBy6
} ; 0qSd#jO
AE1!u{
这样的话assignment也必须相应改动: y5>859"h
U3MfEM!x
template < typename Left, typename Right > :(,uaX>{
class assignment ny17(Y =
{ xd\k;nq
Left l; w> `3{MTQ
Right r; j{EN %
public : uWR\#D'
assignment( const Left & l, const Right & r) : l(l), r(r) {} zzi%r=%r&
template < typename T2 > bLoAtI
T2 & operator ()(T2 & rhs) const { return l(rhs) = r; } agX-V{l.
} ; > Zo_-,
-Cv:lJj
同时,holder的operator=也需要改动: g*Nc+W](P>
t {tcy$bw
template < typename T > 9mkt.>$
assignment < holder, T > operator = ( const T & t) const po+>83/!oq
{ ?!1K@/!
return assignment < holder, T > ( * this , t); zC6,m6Dv
} MIasCH>r
^2OBc
好,这样holder也成为了一个functor,这为我们以后添加功能节省了很多代码。 U/&!F
你可能也注意到,常数和functor地位也不平等。 xN0n0
&AH@|$!E
return l(rhs) = r; A!&p,KfT5+
在这一句中,r没有调用operator()而l调用了。这样以后就要不时的区分常数和functor,是不良的设计。 2MmqGB}YcW
那么我们仿造holder的做法实现一个常数类: hZ-No
UOH2I+@V
template < typename Tp > 5+dQGcE@
class constant_t Iq.*2aff+
{ D1t@Y.vl
const Tp t; /\_`Pkd3m
public : -:t<%]RfY
constant_t( const Tp & t) : t(t) {} N~g@
template < typename T > t8 g^W K
const Tp & operator ()( const T & r) const hv te)
{ ,%e.nj9
return t; s QfP8}U
} a) GLz
} ; *A.E?9pL\
%CJgJ,pk>
该functor的operator()无视参数,直接返回内部所存储的常数。 TO.?h!
下面就可以修改holder的operator=了 ~]BxM9
@ae;&
template < typename T > #p}I 84Q
assignment < holder, constant_t < T > > operator = ( const T & t) const eAS~>|N#x
{ ECqcK~h#E
return assignment < holder, constant_t < T > > ( * this , constant_t < T > (t)); Y!* \=h6h
} J2 {?P
cs
A~&Tp
同时也要修改assignment的operator() ae( o:G
H2`aw3
template < typename T2 > xM}lX(V!w
T2 & operator ()(T2 & rhs) const { return l(rhs) = r(rhs); } vs;T}'O
现在代码看起来就很一致了。 |H 0+.f;
`sOCJ|rc5
六. 问题2:链式操作 !q;EC`i#
现在让我们来看看如何处理链式操作。 LL@VR#n"V
其实问题1已经为我们处理掉了大量的问题。如果_1,functor,常量彼此之间不统一为functor,那么链式操作的时候就要时刻小心一个对象是_1还是functor还是常量,会大大增加编码的难度。 J4!Om&\@
事实上,首先要解决的是,如何知道一个functor的operator()的返回值的类型。遗憾的是,我并没有找到非常自动的办法,因此我们得让functor自己来告诉我们返回值的类型。 E]V:@/(M'
比较麻烦的是,operator()的返回值一般和其参数的类型相关,而operator()通常是一个模版函数,因此其返回值类型并不能用一个简单的typedef来指定,而必须实现一个trait。 &S9Sl
现在我们在assignment内部声明一个nested-struct 9cud CF
,2S w6u
template < typename T > j+NOT`&
struct result_1 ((F[]<?
{ )| @'}k+
typedef typename ref < typename Left::result_1 < T > ::result > ::reference result; Ol3$!x9
} ; JaP2Q} &B
X(kyu,w
那么如果参数为T,其返回值类型就为result_1<T>::result。上面代码的ref<T>为一个类型转换类,作用是返回T的引用。不直接加上&符号的原因是如果T本身就是Q的引用Q&,那么Q&&是非法的。因此ref的实现即为: O0Y/y2d
@SeE,<
template < typename T > j4Ppn
struct ref We%-?l:"
{ n Bv|5$w:
typedef T & reference; lR_ 4iyqb
} ; =qiX0JT
template < typename T > l/0TNOA
struct ref < T &> q\*",xZxwz
{ !fUrDOM0E
typedef T & reference; ~.7r
} ; Y}%=:Yt
v`evuJ\3
有了result_1之后,就可以把operator()改写一下: YqwDvJWX
.q#2 op
template < typename T > hGyi@0
typename result_1 < T > ::result operator ()( const T & t) const c<)C3v
{ )]~'zOE_
return l(t) = r(t); OJe#s;oH
} j/_@~MJBt
可能大家已经注意到我定义assignment的operator()的返回类型的时候,是直接将其定义为Left的operator()返回类型的引用形式,如果实际上处理的对象的operator=并不是按照常理来声明的,那么这段代码可能就编译不过。这的确是一个很麻烦的事情。实际上,在gcc下,使用typeof关键字可以很容易的得到该类型的operator=的返回类型,就可以让这段代码变得更有通用性。然而为了实现可移植性,我不得不放弃这个诱人的想法。 iHhoNv`MR
同理我们可以给constant_t和holder加上这个result_1。 [4B.;MS(
"?a(JC
有了这个result_1,链式操作就简单多了。现在唯一要做的事情就是让所有的functor都重载各种操作符以产生新的functor。假设我们有add和divide两个类,那么 Rda o
_1 / 3 + 5会出现的构造方式是: Es<id}`
_1 / 3调用holder的operator/ 返回一个divide的对象 }
<; y,4f
+5 调用divide的对象返回一个add对象。 ,9Y{x
最后的布局是: *kE2d{h^=C
Add 9v&{;
%U
/ \ 4L\bT;dQ|.
Divide 5 zbn0)JO
/ \ !^BXai/
_1 3 L9[? qFp
似乎一切都解决了?不。 <kIg>+
你可以想象一下一个完整的Lambda库,它必然能够重载C++几乎所有的操作符。假设其重载了10个操作符,那么至少会有10个代表这些操作符的functor类。大体上来讲,每一种操作符所对应的functor都应当能够由链式操作产生别的任意一种操作符所对应的functor。(例如:*_1 = 2既是由operator*的functor产生operator=的functor)。可想而知这样一共能产生10*10=100种产生方式。这是对编码的一个大挑战。 o!EPF-:
如何简化这个问题呢?我们不妨假定,任意一种操作符的functor,都能够产生任意一种操作符的functor,这样,每一种操作符的functor都拥有一样的产生方案。如果某种转换确实是不合法的(例如:A/B=C无论如何也不可能合法),那么在试图产生新functor的时候会出现编译错误。幸好C++的模版是如果不使用就不编译的,因此这种编译错误不会干扰到正常的使用,这正是我们所要的。 Qa~dd{?
OK,我们的方法呼之欲出了。既然所有的functor都具有一样的产生方案,那么不如大家都不要实现,等到最后统一的在所有的functor里面加上这么一系列的产生代码吧。例如,如果要添加从某functor XXX到operator=的functor的产生代码: {tn%HK">
.6S]\dp7~
template < typename Right > +Z[(s!
assignment < XXX, typename picker_maker < Right > ::result > operator = ( const /~*U'.V
Right & rt) const aY7kl
{ xB"o
7,
return assignment < XXX, typename picker_maker < Right > ::result > ( * this , rt); k @'85A`
} w
A<JJ_R
下面对该代码的一些细节方面作一些解释 L/9f"%kZ
XXX指的是原来的functor的类型,picker_maker<T>是一个类型变换的trait,如果T是一个常量,那么他会返回constant_t<T>,否则返回T本身。 yE L^Y'x?
因此如果该函数声明在assignment的内部,那么就实现了连等,如果声明在的dereference(解引用)的内部,就允许(*A = B)的行为发生。 R06q~ >
最后,如何把这些函数塞到各个functor的声明里边呢?当然可以用宏,但是。。。大家都知道这样不好。 Qag@#!&n
除了宏之外还可以用的方式就是继承。我们可以写一个类叫做picker,该类实现了所有的如上的产生函数。然后让所有的functor继承自它。 E8#r<=(m
且慢,也许立刻就有人跳出来说:这样的话那个XXX怎么写呢?这样不是会导致循环依赖么?这样不是会有downcast么? @*jd.a`
正解,让picker做基类确实不是一个好主意。反过来,让picker继承functor却是一个不错的方法。下面是picker的声明: 7RNf)nz
i9fK`:)
template < class Action > "pTyQT9P
class picker : public Action "Wd?U[[
{ 9NvV{WI-1
public : 4jEPh{q
picker( const Action & act) : Action(act) {} j&) "a,f
// all the operator overloaded J/Ki]T9
} ; d54(6N%
>Z
ZX]#=I
Picker<T>继承自T,唯一的作用就是给T添加上了各种操作符的重载函数。 0kP,Zj<
现在所有参与行动的functor都要套上一层picker, _1被声明为 picker<holder>, 并且holder中所重载的操作符除了operator()之外全部被移到了picker内。而picker中的操作符重载的返回的functor也必须套上一个picker: &qqS'G*
c!"&E\F
template < typename Right > Rg~ ~[6G>
picker < assignment < Action, typename picker_maker < Right > ::result > > operator = ( const Right & rt) const J@'}lG
{ sIpq
return assignment < Action, typename picker_maker < Right > ::result > ( * this , rt); \AV6;;}&
} l9
RjxO.~U
Z=`\U?,
Piker_maker返回的也是picker<T>,或者picker<constant_t<T> > m5Gt8Z 6a
使用picker还带来一个额外的好处。之前提到picker_maker要区分functor和常量,有了picker,区分的方法就非常简单了:凡是属于picker<T>的都是functor,否则就是常量。 #UGm/4C
bj^YB,iSM
template < typename T > struct picker_maker zOkU R9
{ vG9A'R'P
typedef picker < constant_t < T > > result; ,W"Q)cL
} ; |NFX"wv:c<
template < typename T > struct picker_maker < picker < T > > >AIkkQT
{ ]v96Q/a
typedef picker < T > result; o<2H~2/
} ; DP`$gd
rQgRD)_%w
下面总的结构就有了: zMasA
functor专心模拟操作符的行为,并实现一个result_1来告诉别人自己的返回类型。 Zn&S7a>7
picker专心负责操作符之间的产生关系,由它来联系操作符合functor。 I8
Ai_^P
picker<functor>构成了实际参与操作的对象。 mf]1mG})
至此链式操作完美实现。 g,/gApa
|KFRC)g
Q.:SIBP
七. 问题3 Yy]^_,r
如何使用多参数的函数对象呢?考虑_1=_2,这个functor必须接受2个参数,因此所产生的assignment对象的operator()必须能接收2个参数。 D/pc)3Ofe
#MYhKySku
template < typename T1, typename T2 > T1yJp$yD"
??? operator ()( const T1 & t1, const T2 & t2) const Z!o&};_j
{ \9*wo9cV
return lt(t1, t2) = rt(t1, t2); ImQ?<g8$
} `Cy-*$$
++ !BSQ e
很明显,这个函数的返回类型会依赖于T1,T2,因此result_1已经无法适用,我们就只好再写一个result_2: )HWf`;VQ
@mM'V5_#
template < typename T1, typename T2 > xv;'27mUt
struct result_2 7kapa59
{ v#i,pBj
typedef typename ref < typename Left::result_2 < T1, T2 > ::result > ::reference result; 2OFrv=F
} ; .} <$2.
J5PXmL
显然,各个functor似乎根本不理会各个参数那个是_1, 那个是_2, 那么最后是怎么选择的呢? boAu
这个差事就留给了holder自己。 NFpR jC?
w7}m
T3p,)
"F%w{bf
template < int Order > ta\AiHm
class holder; @#[<5ld
template <> tpp. 9
class holder < 1 > =9@{U2 =l
{ 3n-~+2l
public : 9fR`un)f}
template < typename T > y\7 -!
struct result_1 3}{od$3G
{ Yg@k+
typedef T & result; R<aF;Rvb5
} ; ]H8,}
template < typename T1, typename T2 > +$R4'{9q
struct result_2 h ,;f6
{ #`R`!4
typedef T1 & result; )=6|G^
} ; $OMTk
template < typename T > P+00wbx0
typename result_1 < T > ::result operator ()( const T & r) const #=r:;,,
{ "bZ{W(h
return (T & )r; t3%[C;@wB
} FTvFtdY
template < typename T1, typename T2 > j?sq i9#
typename result_2 < T1, T2 > ::result operator ()( const T1 & r1, const T2 & r2) const .: ~);9kj
{ RL0,QC)e#@
return (T1 & )r1; GZgu1YR
} tVJ}NI #
} ; D0Cs
g39
3dm lP2
template <> ;`<uo$R
class holder < 2 > ir^%9amh
{ g_8Bhe"ik
public : ;w,+x 7
template < typename T > 8nn%wps
struct result_1 .*+?]
{ tNf?pV77
typedef T & result; f
S-(Kmh
} ; >D20f<w(H
template < typename T1, typename T2 > $|~YXH~O
struct result_2 f?)BAah
{ y>}dKbCN
typedef T2 & result; S !Dq8
} ; 3D<s#
template < typename T > dd4g?):
typename result_1 < T > ::result operator ()( const T & r) const 3Z.<=D
{ &K
Ti[
return (T & )r; *h59Vaoc
} {=n-S2%
template < typename T1, typename T2 > 6`(x)Q9
typename result_2 < T1, T2 > ::result operator ()( const T1 & r1, const T2 & r2) const w6ZyMR,T
{ Y>v(UU
return (T2 & )r2; bs{i@1$
} !ER,o_T<
} ; nk8jXZ"w
,CACQhrng
r9:Cq
新的holder变成了holder<int>, holder<n>的n个参数的operator()会返回第n个参数的值。而_1,_2也相应变为picker<holder<1> >, picker<holder<2> >。 2xy
&mNx
现在让我们来看看(_1 = _2)(i. j)是怎么调用的: ?V6A:8t,
首先 assignment::operator(int, int)被调用: V'[Lqe,y
]z5`!e)L
return l(i, j) = r(i, j); [k)xn3[
先后调用holder<1>::operator()(int, int)和holder<2>::operator()(int, int) $-4OveS~B
v5J%
p4
return ( int & )i; U/2]ACGCN^
return ( int & )j; h>>KH*dQ
最后执行i = j; ]:Y@pZ
可见,参数被正确的选择了。 (.6~t<DRv
a "*DJ&