一. 什么是Lambda "v({,
所谓Lambda,简单的说就是快速的小函数生成。 91-o}|3v
在C++中,STL的很多算法都要求使用者提供一个函数对象。例如for_each函数,会要求用户提供一个表明“行为”的函数对象。以vector<bool>为例,如果想使用for_each对其中的各元素全部赋值为true,一般需要这么一个函数对象, ;{tj2m,
x%!s:LVX
f-G:uI_
h2J/c#Qvh
class filler 8~z~_TD6m@
{ 6){]1h"
public : e-#BDN(O
void operator ()( bool & i) const {i = true ;} nWYN Np?h
} ; E`de7
n'kG] Q
=Bhe'.]QSx
这样实现不但麻烦,而且不直观。而如果使用lambda,则允许用户使用一种直观和见解的方式来处理这个问题。以boost.lambda为例,刚才的问题可以这么解决: fd<:_f]v
'yG4
LF
o{q{!7DH@
.ndCfdy~
for_each(v.begin(), v.end(), _1 = true ); ?3zc=J"t
aYS!xh206
2:7zG"$
那么下面,就让我们来实现一个lambda库。 n+q!l&&
Zxs|%bQ
!()$8
wL
4dTc
二. 战前分析 _zn.K&I-*k
首先要说明的是,我并没有读过boost.lambda或其他任何lambda库的代码,因此如代码有雷同,纯属巧合。 *<jAiB,O*
开始实现以前,首先要分析出大致的实现手法。先让我们来看几段使用Lambda的代码 Q1
$^v0-)
{NFr]LGOp
@l jA
for_each(v.begin(), v.end(), _1 = 1 ); _ff`y
/* --------------------------------------------- */ nR}sNl1
vector < int *> vp( 10 ); 5l 2 ?
transform(v.begin(), v.end(), vp.begin(), & _1); IIF]/Ek]
/* --------------------------------------------- */ se>8 Z4
sort(vp.begin(), vp.end(), * _1 > * _2); Cdu4U}^H
/* --------------------------------------------- */ k_5L4c:"
int b = * find_if(v.begin, v.end(), _1 >= 3 && _1 < 5 ); q?DTMKx
/* --------------------------------------------- */ v}O30wE
for_each(vp.begin(), vp.end(), cout << * _1 << ' \n ' ); 'o+L41
/* --------------------------------------------- */ ^l=!JP=M=
for_each(vp.begin(), vp.end(), cout << constant( ' \n ' ) << * _1); }v!$dr,j'
Vjp1RWb
*4+"Lh.KS
C=)A6
;=se
看了之后,我们可以思考一些问题: P.;aMRMR
1._1, _2是什么? (#Gw1
显然_1和_2都满足C++对于标识符的要求,可见_1和_2都是对象。 ^O<&f D
2._1 = 1是在做什么? J|kR5'?x
既然_1是一个对象,那么_1的类必然重载了operator=(int)。那么operator=返回什么呢?该函数所返回的对象被传入for_each的第3个参数,可见其返回了一个函数对象。现在整个流程就很清楚了。_1 = 1调用了operator=,其返回了一个函数对象,该函数对象能够将参数1赋值为1。 ()Y4v
Ok,回答了这两个问题之后,我们的思路就很清晰了。如果要实现operator=,那么至少要实现2个类,一个用于产生_1的对象,另一个用于代表operator=返回的函数对象。 TKY*`?ct
,t9^j3Ixg
&d+Kg0 :
三. 动工 aM2l2
首先实现一个能够范型的进行赋值的函数对象类: ;q:zT\A
$M lW4&a|
Ax?y
"UGY2skf;
template < typename T > _w/EP
class assignment D!NQ~'.a=2
{ mdmvT~`
T value; !tMuuK?IL=
public : ^~@U]
assignment( const T & v) : value(v) {} *`\Pr
template < typename T2 > v~V5`%
T2 & operator ()(T2 & rhs) const { return rhs = value; } Vq5k+3W+
} ; CBOi`bEf
L,`Lggq-
y?m/*hh`
其中operator()被声明为模版函数以支持不同类型之间的赋值。 G_{&sa
然后我们就可以书写_1的类来返回assignment ];a=Pn-:}G
l@ H
0Lc9M-Lg
xtE_=5$~
class holder !?p%xj?
{ ujaGNg?,
public : !2A:"2Kys:
template < typename T > +!z{5:
assignment < T > operator = ( const T & t) const 'EF9Zt8
{ zb}9%.U
return assignment < T > (t); Z!@~>i
} *-q"3D`
} ; 0]=i}wL 8
8x8uo
=aA+~/~8%
由于该类是一个空类,因此我们可以在其后放心大胆的写上: =aj/,Q]
e2ilB),
static holder _1; feNdMR7eM
Ok,现在一个最简单的lambda就完工了。你可以写 zj`v?#ET
7_Z#m (
for_each(v.begin(), v.end(), _1 = 1 ); F\AX:
而不用手动写一个函数对象。 &nkW1Ner9
OCJnjlV%
LbG_ z =A
J'fQW<T4wU
四. 问题分析 .0iQad&duh
虽然基本上一个Lambda已经初步实现出来了,但是仔细想想,问题也是很多的。 U.XNv-M
1, 我们现在是把_1和functor看成两个不同的存在,会导致代码的重复。 #iWSDy
2, 目前这个Lambda还无法实现如_1 = 2 = 3这样的链式操作。 R_68-WO
3, 我们没有设计好如何处理多个参数的functor。 wX[8A/JPD
下面我们可以对这几个问题进行分析。 2viM)+
mc_ch$r!
五. 问题1:一致性 9@52Fg;mj
首先来看看1,合并_1和functor的最佳方法就是把_1本身也变成functor。那么_1的operator()会做什么事情呢?| W#BM(I
很明显,_1的operator()仅仅应该返回传进来的参数本身。 J6%AH?Mt
{%{`l-
struct holder @t`Xq1
{ gk+h8 LZ
// }!/$M\w
template < typename T > !Mim@!5M
T & operator ()( const T & r) const &f^l^K5:
{ Jn3 An
return (T & )r; 1Q4}'0U4
} $Y_i4(
} ; 1jPJw3"3h
{]_r W/
这样的话assignment也必须相应改动: N:tY":Hi
X
9%'|(tL
template < typename Left, typename Right > w@c87;c
class assignment |-
rI@2`
{ ,^ WJm?R
Left l; >O?U=OeD
Right r; J?}WQLVP'
public : i|}[A
assignment( const Left & l, const Right & r) : l(l), r(r) {} psC
mbN
template < typename T2 > !]fQ+ *X0g
T2 & operator ()(T2 & rhs) const { return l(rhs) = r; } q7Dw_<
} ; o{EC&-
iMFgmM|
同时,holder的operator=也需要改动: E}_[QEY;Y
=;|QZ"%E
template < typename T > FwY&/\J7V
assignment < holder, T > operator = ( const T & t) const f<*Js)k
{
MR,R}B$
return assignment < holder, T > ( * this , t); I,VH=Yn5,
} 3a 1 u
3g~^[&|i
好,这样holder也成为了一个functor,这为我们以后添加功能节省了很多代码。 wTGbd
你可能也注意到,常数和functor地位也不平等。 ]f: v,a
TsUOpEuX
return l(rhs) = r; -zO2|@S,
在这一句中,r没有调用operator()而l调用了。这样以后就要不时的区分常数和functor,是不良的设计。 {^rs#, W
那么我们仿造holder的做法实现一个常数类: k`9)=&zX+
`S.ZS}~!F
template < typename Tp > )0e2ic/
class constant_t d]i(h~?_
{ RUUk
f({(
const Tp t; !>`N$-U X
public : <ggtjw S
constant_t( const Tp & t) : t(t) {} !!V#v9{
template < typename T > #gaQaUjR
const Tp & operator ()( const T & r) const G0{H5_h
{ {}m PEd b
return t; nG,U>)
} >Clh] ;K
} ; XfE -fH1j
`#QG6/0
该functor的operator()无视参数,直接返回内部所存储的常数。 o|iYd
n\
下面就可以修改holder的operator=了 c8M2 ^{O,`
aJe^Tp(
template < typename T > ^eGNgE
assignment < holder, constant_t < T > > operator = ( const T & t) const CWG6;NT6m
{ NU\
5{N<
return assignment < holder, constant_t < T > > ( * this , constant_t < T > (t)); #9fWAF
}
|R@~-Ht
~h=X8-D
同时也要修改assignment的operator() ',4x$qe
d:q +
template < typename T2 > G633Lm`ri
T2 & operator ()(T2 & rhs) const { return l(rhs) = r(rhs); } ;HBCUe<_
现在代码看起来就很一致了。 7HJS.047
{d%&zvJnD
六. 问题2:链式操作 9W>Y#V~|v!
现在让我们来看看如何处理链式操作。 -l-E_6|/W
其实问题1已经为我们处理掉了大量的问题。如果_1,functor,常量彼此之间不统一为functor,那么链式操作的时候就要时刻小心一个对象是_1还是functor还是常量,会大大增加编码的难度。 u!U"N*Y"
事实上,首先要解决的是,如何知道一个functor的operator()的返回值的类型。遗憾的是,我并没有找到非常自动的办法,因此我们得让functor自己来告诉我们返回值的类型。 -MugnB6
比较麻烦的是,operator()的返回值一般和其参数的类型相关,而operator()通常是一个模版函数,因此其返回值类型并不能用一个简单的typedef来指定,而必须实现一个trait。 u=NSsTP&
现在我们在assignment内部声明一个nested-struct j9U%7u]-k
qXW})(
template < typename T > J.+BD\pa
struct result_1 8; R|
{ z6~
H:k1G%
typedef typename ref < typename Left::result_1 < T > ::result > ::reference result; XJ+6FT/qss
} ; %77p5ctW
@[?!s%*2
那么如果参数为T,其返回值类型就为result_1<T>::result。上面代码的ref<T>为一个类型转换类,作用是返回T的引用。不直接加上&符号的原因是如果T本身就是Q的引用Q&,那么Q&&是非法的。因此ref的实现即为: nGf);U#K
u@P[Vb
template < typename T > omf Rs
struct ref cZ+7.oDu
{ yag}fQ(XH
typedef T & reference; GOB(#vu
} ; !epgTN
template < typename T > HXVBb%pP
struct ref < T &> L]hXpt
{ W*:,m8wk
typedef T & reference; LFp]7Dq
} ; desThnTw
,kp\(X[J
有了result_1之后,就可以把operator()改写一下: 4^'3&vu
m&oi8 P-6
template < typename T > T\# *S0^
typename result_1 < T > ::result operator ()( const T & t) const Ekm7 )d$
{ 6V+ qnUk
return l(t) = r(t); &>jAe_{",
} ] 43bere
可能大家已经注意到我定义assignment的operator()的返回类型的时候,是直接将其定义为Left的operator()返回类型的引用形式,如果实际上处理的对象的operator=并不是按照常理来声明的,那么这段代码可能就编译不过。这的确是一个很麻烦的事情。实际上,在gcc下,使用typeof关键字可以很容易的得到该类型的operator=的返回类型,就可以让这段代码变得更有通用性。然而为了实现可移植性,我不得不放弃这个诱人的想法。 "4j:[9vR\
同理我们可以给constant_t和holder加上这个result_1。 }^K/?dM
}T0K^Oe+eS
有了这个result_1,链式操作就简单多了。现在唯一要做的事情就是让所有的functor都重载各种操作符以产生新的functor。假设我们有add和divide两个类,那么 p(m1O70C
_1 / 3 + 5会出现的构造方式是: qy!Ou3^
_1 / 3调用holder的operator/ 返回一个divide的对象 X#UMIlU
+5 调用divide的对象返回一个add对象。 wj|x:YZ*
最后的布局是: >7U>Yh
Add j#6|V]l
/ \ iG,t_??
Divide 5 \hP=-J [~C
/ \ jN+N(pIi.o
_1 3 X7|.T0{=x
似乎一切都解决了?不。 QI[}(O7#6
你可以想象一下一个完整的Lambda库,它必然能够重载C++几乎所有的操作符。假设其重载了10个操作符,那么至少会有10个代表这些操作符的functor类。大体上来讲,每一种操作符所对应的functor都应当能够由链式操作产生别的任意一种操作符所对应的functor。(例如:*_1 = 2既是由operator*的functor产生operator=的functor)。可想而知这样一共能产生10*10=100种产生方式。这是对编码的一个大挑战。 .2\0~x""
如何简化这个问题呢?我们不妨假定,任意一种操作符的functor,都能够产生任意一种操作符的functor,这样,每一种操作符的functor都拥有一样的产生方案。如果某种转换确实是不合法的(例如:A/B=C无论如何也不可能合法),那么在试图产生新functor的时候会出现编译错误。幸好C++的模版是如果不使用就不编译的,因此这种编译错误不会干扰到正常的使用,这正是我们所要的。 kao}(?x%
OK,我们的方法呼之欲出了。既然所有的functor都具有一样的产生方案,那么不如大家都不要实现,等到最后统一的在所有的functor里面加上这么一系列的产生代码吧。例如,如果要添加从某functor XXX到operator=的functor的产生代码: &Rz,
J]
=]Hs|{
template < typename Right > }98>5%Uv
assignment < XXX, typename picker_maker < Right > ::result > operator = ( const 3Gr&p6
Right & rt) const D0]a\,aZ
{ w,j cm;
return assignment < XXX, typename picker_maker < Right > ::result > ( * this , rt); D~&Mwsi
} iY/KSX^~O
下面对该代码的一些细节方面作一些解释 <B&R6<]T
XXX指的是原来的functor的类型,picker_maker<T>是一个类型变换的trait,如果T是一个常量,那么他会返回constant_t<T>,否则返回T本身。 k6?cP0I)5
因此如果该函数声明在assignment的内部,那么就实现了连等,如果声明在的dereference(解引用)的内部,就允许(*A = B)的行为发生。 <<|H=![
最后,如何把这些函数塞到各个functor的声明里边呢?当然可以用宏,但是。。。大家都知道这样不好。 qq0?e0H
除了宏之外还可以用的方式就是继承。我们可以写一个类叫做picker,该类实现了所有的如上的产生函数。然后让所有的functor继承自它。 =OV2 uq
且慢,也许立刻就有人跳出来说:这样的话那个XXX怎么写呢?这样不是会导致循环依赖么?这样不是会有downcast么? M_D6i%b^
正解,让picker做基类确实不是一个好主意。反过来,让picker继承functor却是一个不错的方法。下面是picker的声明: lZt(&^T
jB^OP1
template < class Action > "]-],K
class picker : public Action 3rf#Q}"
{ M\+* P,i
public : 88a<{5
:z
picker( const Action & act) : Action(act) {} e}cnX`B
// all the operator overloaded Hwe)Tsh e
} ; H.J5i~s
?&h3P8
Picker<T>继承自T,唯一的作用就是给T添加上了各种操作符的重载函数。 =ziy`#fm,
现在所有参与行动的functor都要套上一层picker, _1被声明为 picker<holder>, 并且holder中所重载的操作符除了operator()之外全部被移到了picker内。而picker中的操作符重载的返回的functor也必须套上一个picker: Oz:ZQ M
yNJAWM7
template < typename Right > 2+92Q_+
picker < assignment < Action, typename picker_maker < Right > ::result > > operator = ( const Right & rt) const D\T!4q'Q
{ bn 4
&O
return assignment < Action, typename picker_maker < Right > ::result > ( * this , rt); 8]0:1
{@
} qGPb
%bX0 mN
Piker_maker返回的也是picker<T>,或者picker<constant_t<T> > MdhT!?
使用picker还带来一个额外的好处。之前提到picker_maker要区分functor和常量,有了picker,区分的方法就非常简单了:凡是属于picker<T>的都是functor,否则就是常量。 R/<=mZ
f'dK73Xof
template < typename T > struct picker_maker cc>
{ =!-5+I#e
typedef picker < constant_t < T > > result; ~ |,e_
zA
} ; _&
4its
template < typename T > struct picker_maker < picker < T > > ? Ekq6uz\)
{ H]qq ~bO[
typedef picker < T > result; mR":z|6
} ; voRfjsS~
":d*dl
下面总的结构就有了: jgvh[@uB?
functor专心模拟操作符的行为,并实现一个result_1来告诉别人自己的返回类型。 uJ'9R`E ]1
picker专心负责操作符之间的产生关系,由它来联系操作符合functor。 `f ' C[a"
picker<functor>构成了实际参与操作的对象。 fEu9Jk
至此链式操作完美实现。 +>3]%i-\
It
2UfW
1]/N2&
七. 问题3 ,p,Du
F
如何使用多参数的函数对象呢?考虑_1=_2,这个functor必须接受2个参数,因此所产生的assignment对象的operator()必须能接收2个参数。 U=o Z.\
a0zG(7.D
template < typename T1, typename T2 > NR/-m7#-
??? operator ()( const T1 & t1, const T2 & t2) const | Odu4 Q
{ +6%7CC 6
return lt(t1, t2) = rt(t1, t2); l6B.6
'4)w
} q?VVYZXP
y=o=1(
很明显,这个函数的返回类型会依赖于T1,T2,因此result_1已经无法适用,我们就只好再写一个result_2: JY4_v>Aob
x9`ZO<L$
template < typename T1, typename T2 > 2uo8j F.h
struct result_2 YbvX$/zGu
{ FH n,]Tfx
typedef typename ref < typename Left::result_2 < T1, T2 > ::result > ::reference result; ^L~ [+|
} ; *t=i
'=%i,
显然,各个functor似乎根本不理会各个参数那个是_1, 那个是_2, 那么最后是怎么选择的呢? 7L{li-crI
这个差事就留给了holder自己。 p6blD-v
c57b f
S_!R^^ySG9
template < int Order > >7FSH"8[,
class holder; -g2{681`r
template <> G(i\'#5+
class holder < 1 > l Z~+u
{ ]b\WaS8I
public : Rk[8Bd?
template < typename T > CB@B.)E
struct result_1 |,fh)vO
{ x[m'FsR4
typedef T & result; T^.{9F]*S
} ; U~g@TfU;
template < typename T1, typename T2 > zlX!xqHj
struct result_2 U5wTGv4S|
{ v =+k"gm6
typedef T1 & result; )K.R\]XR
} ; CI1m5g [P
template < typename T > S^g]:Xh&
typename result_1 < T > ::result operator ()( const T & r) const cd"wNH-
{ 2TCRS#z
return (T & )r; `hF;$
} g Np-f
template < typename T1, typename T2 > \R;K>c7=
typename result_2 < T1, T2 > ::result operator ()( const T1 & r1, const T2 & r2) const v =bv@c
{ ;G$)MS'nB
return (T1 & )r1; ks^|>
} 0-
Yeu5A
} ; $pBr
&,
^k9rDn/AW
template <> K-Y*T}?
class holder < 2 > $UmE
{ h=wf>^l
public :
`QAh5r"
template < typename T > 7#/|VQX<A
struct result_1 <lX:eR1
{ R^?PAHE7
typedef T & result; j<|6s,&
} ; =tP$re";o
template < typename T1, typename T2 > I1J)#p%H.
struct result_2 .i\wE@v
{ 1#kawU6[]
typedef T2 & result; %[+/>e/m
} ; S&`O\!NF
template < typename T > -&~IOqlui
typename result_1 < T > ::result operator ()( const T & r) const I]UA0[8X
{ mc56L[
return (T & )r; \Em-.%c
} iqlVlm>E
template < typename T1, typename T2 > IM|Se4;x
typename result_2 < T1, T2 > ::result operator ()( const T1 & r1, const T2 & r2) const @%keTTZ
{ t;~-_{
return (T2 & )r2; FrgV@4'2G
} kt5YgW
} ; $/y%[ .
7@\GU].2
#s/{u
RYQ
新的holder变成了holder<int>, holder<n>的n个参数的operator()会返回第n个参数的值。而_1,_2也相应变为picker<holder<1> >, picker<holder<2> >。 hG[4O3jo\
现在让我们来看看(_1 = _2)(i. j)是怎么调用的: @YbZ8Uc
首先 assignment::operator(int, int)被调用: Hm<M@M$aG
-<12~HKK::
return l(i, j) = r(i, j); gtl;P_
先后调用holder<1>::operator()(int, int)和holder<2>::operator()(int, int) aSxG|OkKy
Ny[s+2?
return ( int & )i; "Vq@bNtu+
return ( int & )j; y>&VtN{E
最后执行i = j; )<tzm'Rc
可见,参数被正确的选择了。 8:BQHYeJK
oO}>i0ax*
X$ejy/+.
E{?L= ^cU
~|J*E38
八. 中期总结 @b>YkJDk
目前的结果是这样的,为了支持一个操作符,我们需要作如下几件事: q8tP29
1。 实现一个functor,该functor的operator()要能执行该操作符的语义 {!>E9Px
2。 在该functor中实现result_1至result_n,其中n是支持参数的最大值。 =54Vs8.
3。 在picker中实现一个操作符重载,返回该functor )OS>9
kFH
" Tw0a!
e*6U |+kJ
+KYxw^k}"7
Udg&
eEF
/6 A:J]Q_
九. 简化 2M5*bNU_:
很明显,要支持一个操作符所要做的工作太多了,而且在每个functor中申明result_1至result_n,可见如果n发生变化,维护的开销极大。 WCWSLEAza
我们现在需要找到一个自动生成这种functor的方法。 '&1
首先,我们注意到result_x的形式很统一。对于各种操作符,其返回值无非下列几种: u>j 5`OXo
1. 返回值。如果本身为引用,就去掉引用。 DPR;$yV
+-*/&|^等 ,5`."-0}
2. 返回引用。 z1)$
=,各种复合赋值等 s n=zh1 A
3. 返回固定类型。 W'm!f
各种逻辑/比较操作符(返回bool) !e9N3Ga
4. 原样返回。 ]Sk#a-^~
operator, {: Am9B
5. 返回解引用的类型。 #xD&z^o
operator*(单目) Jq=X!mTd.
6. 返回地址。 A;b=E[iv
operator&(单目) p,!fIx
7. 下表访问返回类型。 V_7Y1GD
operator[] zLE>kK
8. 如果左操作数是一个stream,返回引用,否则返回值 wGZ>iLe:
operator<<和operator>> *tIdp`xT/T
m[//_TFf]
OK,这样我们将返回值类型总结为以上8种,就可以将各种result_x从functor中剥离出来了。 UA1]o5K
例如针对第一条,我们实现一个policy类: %D`^
ktkn2Twa/
template < typename Left > \fkS_r, i
struct value_return :9v*,*@x
{ )ylv(qgV
template < typename T > ~m009
struct result_1 f]{1ZU%4
{ /7!_un9
typedef typename const_value < typename Left::template result_1 < T > ::result_type > ::value_type result_type; >;T$#LZ
} ; "P>$=X~Zi
ym-lT|>Z
template < typename T1, typename T2 >
3J'Bm"
struct result_2 ,k`YDy|#e
{ m? ]zomP
typedef typename const_value < typename Left::template result_2 < T1, T2 > ::result_type > ::value_type result_type; Ncs4<"{$
} ; nph7&[xQI
} ; :e5:\|5*5
z_)OWWdN
>e5q2U
其中const_value是一个将一个类型转为其非引用形式的trait ^!-E`<jW8
tU-#pB>H
下面我们来剥离functor中的operator() %N?W]vbra
首先operator里面的代码全是下面的形式: 'b?#4rq}
%Q>~7P
return l(t) op r(t) Q>06dO~z8
return l(t1, t2) op r(t1, t2) JI{OGr
return op l(t) &m