T h e o r . Ap p l . G e n e t . 49 (1977) 265-271

9 by Springer-Verlag 1977

Das Ausmal asymmetrischer Basenverteilung in eukaryotischen Genen R . P i e c h o c k i , W. B e r g und A. B e r g m a n n W i s s e n s c h a f t s b e r e i c h G e n e t i k d e r S e k t i o n B i o w i s s e n s c h a f t e n , M a r t i n - L u t h e r - U n i v e r s i t ~ i t , H a l l e ( S a a l e ) , DDR D e u t s c h e A k a d e m i e d e r N a t u r f o r s c h e r L e o p o l d i n a , A r c h i v , H a l l e ( S c a l e ) , DDR A b t e i l u n g A n a l y s e und P r o g r a m m i e r u n g , O r g a n i s a t i o n s - und R e c h e n z e n t r u m d e r M a r t i n - L u t h e r - U n i v e r s i t ~ i t , H a l l e ( S c a l e ) , DDR The E x t e n t of A s y m m e t r i c D i s t r i b u t i o n of D N A - B a s e s in G e n e s S u m m a r y . The c o r r e l a t i o n b e t w e e n the e v o l u t i o n a r y r a t e s of p r o t e i n s and f r e q u e n c i e s of D N A - b a s e s in t he f i r s t and in the s e c o n d p o s i t i o n of c o r r e s p o n d i n g c o d o n s was i n v e s t i g a t e d . A d e n i n e in t he f i r s t and g u a n in e in th e s e c o n d p o s i t i o n s h o w e d the s t r o n g e s t p o s i t i v e c o r r e l a t i o n with e v o l u t i o n a r y r a t e w h e r e a s c y t o s i n e in the f i r s t as well a s in the s e c o n d p o s i t i o n s h o w e d a s t r o n g n e g a t i v e c o r r e l a t i o n . The c o r r e l a t i o n can not be e x p l a i n e d by a s i g n i f i c a n t c h a n g e in G C - c o n t e n t but r a t h e r by t h e a s y m m e t r i c d i s t r i b u tion of the b a s e p a i r s . The e x t e n t of p y r i m i d i n e / p u r i n e a s y m m e t r y was a s s e s s e d q u a n t i t a t i v e l y . V a r i a t i o n s in f r e q u e n c i e s of b a s e s l e a d to c h a n g e d f r e q u e n c i e s of n e i g h b o u r i n g b a s e s and thus to c h a n g e d i n t e r a c t i o n s b e t w e e n a d j a c e n t b a s e s in th e g e n e s . Slowly e v o l v i n g p r o t e i n s a r e co d ed by g e n e s with a m a x i m u m of t h e r m o d y n a m i c i n t e r a c t i o n s b e t w e e n th e a d j a c e n t b a s e s in the c o d o g e n e o u s c h a i n as well as in t h e c o m p l e m e n t a r y c h a i n . The g e n e s f o r highly e v o l v i n g p r o t e i n s a r e c h a r a c t e r i z e d by m i n i m a i n t e r a c t i o n s b e t w e e n a d j a c e n t bases. The possible relations between a s y m m e t r y and mutability of genes are discussed. Z u s a m m e n f a s s u n g . D ie K o r r e l a t i o n z w i s c h e n den E v o l u t i o n s r a t e n d e r P r o t e i n e und den Basenh~iufigkeiten in den 1. und 2. P o s i t i o n e n d e r z u g e h b r i g e n D N S - C o d o n e n w u r d e u n t e r s u c h t . A d e n i n in d e r 1. und Guanin in d e r 2. T r i p l e t t p o s i t i o n w e i s e n die st~irksten p o s i t i v e n K o r r e l a t i o n e n m i t den E v o l u t i o n s r a t e n auf, w~ihrend C y t o s i n sowohl in d e r 1. ats a u c h in d e r 2. P o s i t i o n s t a r k n e g a t i v k o r r e l i e r t . D i e K o r r e l a t i o n e n w e r d e n nicht d u r c h v e r s c h i e d e n e G C - G e h a l t e , s o n d e r n d u r c h a s y m m e t r i s c h e V e r t e i l u n g e n tier B a s e n v e r u r s a c h t . D i e daftir v e r a n t w o r t l i c h e P y r i m i d i n / P u r i n - A s y m m e t r i e w u r d e q u a n t i t a t i v c h a r a k t e r i s i e r t . Ver~inderungen in den Basenh~iufigkeiten fiihren zu v e r ~ i n d e r t e n N a c h b a r s c h a f t s h ~ i u f i g k e i t e n und d a d u r c h zu u n t e r s c h i e d l i c h starken Basenwechselwirkungen innerhalb der Gene: P r o t e i n e mit e i n e r geringen Evolutionsr a t e w e r d e n d u t c h G e n e c o d i e r t , d e r e n W e c h s e l w i r k u n g s e n e r g i e n in e r s t e r N~iherung sowohl i m c o d o g e n e n a l s a u c h im k o m p l e m e n t ~ i r e n S t r a n g m a x i m i e r t s i n d . D i e Gene yon P r o t e i n e n m i t hohen E v o l u t i o n s r a t e n sind d u r c h geringere Wechselwirkungen zwischen benachbarten Basen charakterisiert. D i e m b g l i c h e n B e z i e h u n g e n z w i s c h e n A s y m m e t r i e und Mutabilit~it tier G e n e w e r d e n d i s k u t i e r t .

1. E i n l e i t u n ~

C o d e s ein GroBteil a l l e r m S g l i c h e n M u t a t i o n e n nicht zu e i n e r Ver~inderung yon A m i n o s ~ i u r e s e q u e n z e n d e r

S e i t d e m das M a t e r i a l d e r E v o l u t i o n b i s z u m m o l e k u l a r e n N i v e a u a n a l y s i e r t w e r d e n kann, i s t die D i s k u s -

P r o t e i n e fiihrt ( K i m u r a 1968b). 2. P r o t e i n p o l y m o r p h i s m e n s o w i e V e r g l e i c h e d e r

s i o n um " s e l e k t i o n s n e u t r a l e " M u t a t i o n e n nicht m e h r

Proteinevolutionsraten machten deutlich,

verstummt.

s e h r v i e l e n P o s i t i o n e n in P r o t e i n e n Aminos~iuren ohne

E i n l e u c h t e n d e n A r g u m e n t a t i o n e n ffir d e -

dab an

r e n E x i s t e n z ( z u e r s t bei K i m u r a 1968a; King und

W i r k u n g auf S t r u k t u r und F u n k t i o n d e r P r o t e i n e a u s -

J u k e s 1969; A r n h e i m und T a y l o r 1969; U b e r s i c h t

g e t a u s c h t s e i n k6nnen ( A r n h e i m und T a y l o r 1969~ K i -

bei K i m u r a und Ohta 1974) s t e h e n d e t a i l l i e r t e K r i t i -

m u r a und Ohta 1971).

ken g e g e n i i b e r ( R i c h m o n d 1970; C l a r k e 1970). D i e

Wenn a b e r ein m e h r o d e r w e n i g e r g r o B e r Teil d e r

G rt i n d e ffir d i e E x i s t e n z und B e d e u t u n g " s e l e k t i o n s -

N u k l e o t i d s u b s t i t u t i o n e n s i c h n i ch t o d e r nicht w e s e n t -

n e u t r a l e r " M u t a t i o n e n s i n d auf den e r s t e n B l i c k

l i c h au f die S t r u k t u r und F u n k t i o n d e r P r o t e i n e a u s -

s t i c h h a l t i g : 1. N a c h d e r E n t z i f f e r u n g d e s g e n e t i s c h e n

w i r k t , dann kann d i e G e s c h w i n d i g k e i t und Richtung

C o d e s w u r d e g e z e i g t , dab d u r c h die D e g e n e r a t i o n d e s

d e r E v o l u t i o n n i ch t so s e h r d u r c h S e l e k t i o n b e s t i m m t

266

T h e o r . Appl. G e n e t . 49 (1977)

werden, sondern - mindestens auch - dutch die Fix-

stischer Analysen wurde versucht abzusch~tzen, ob

ierung solcher "selektionsneutraler" Mutationen

es sich - wie nach der "neutral mutation-random

(Laird, M c C o n a u g h y und McCarthy 1969).

drift hypothesis" zu erwarten - u m

K i m u r a (1968a) entwickelte aus diesen Ans~tzen

zufillige Unter-

schiede handelt oder u m systematisohe. Es ergab

seine "neutral mutation - random drift hypothesis",

sich, dab die A s y m m e t r i e der Basenverteilungen in

woffir King und Jukes (1969) den m e h r provokativen

den Gensequenzen mit der A b n a h m e der Evolutions-

Ausdruck "Non-Darwinian Evolution" w~hlten.

geschwindigkeiten der Proteine stark zunimmt. D a diese systematischen Ver~nderungen der Basenh~u-

Ein Argument gegen die Neutralit~t der "selektionsneutralen" Mutationen war, dab Nukleotidver~n-

figkeit ver~nderte Nachbarsehaftsbeziehungen zur Fol-

derungen, die keinen Einflu~ auf Struktur und Funk-

ge haben, lassen sich konkrete SchluBfolgerungen for

tion der Proteine haben, dutch die ver~nderten Ba-

die Stabilit~t verschiedener Gene ziehen.

sensequenzen in den Genen selbst durchaus einen wesentlichen Effekt haben kSnnten (Bichmond 1970; Clarke 1970). Nach d e m heutigen Wissen k o m m e n ffir sowohl die Weohselwirkungenvon

da-

D N S und Protei-

2. D e f i n i t i o n und q u a n t i t a t i v e C h a r a k t e r i s i e r u n ~ d e r " A s y m m e t r i e " yon B a s e n v e r t e i l u n g e n

hen als auch die Transkription, Translation und Muta-

U b e r die V a r i a b i l i t ~ t des GC ( G u a n i n + C y t o s i n ) -

bilit~t der einzelnen Gene in Frage. Es ist wissenschaftshistorisch interessant, dab zu Beginn der molekularbiologischen Diskussion u m "neutrale" Mutationen experimentelle und theoretische Daten iiber die Mutabilit~t yon Genen und fiber die Wechselwirkungen zwischen benachbarten Basen bekannt waren, die der Theorienbildung durohaus ein anderes Gesicht hitten geben k6nnen. Benzer und Freese (1958) und Benzer (1961) bewiesen, dab Nukleotidsubstitutionen die Mutabilit~t benaohbarter Basensequenzen entscheidend ver~ndern kSnnen. An-

G e h a l t e s in v e r s c h i e d e n e n O r g a n i s m e n g r u p p e n l i e g e n m e h r e r e U n t e r s u c h u n g e n v o r (Sueoka 1961; S i n g e r und A m e s 1970). Da G und C des E i n z e l s t r a n g e s in d e r Doppelhelix a l s GC bzw. CG P a a r e v o r l i e g e n , i s t d e r Anteil a n G+C s t e t s in b e i d e n S t r ~ n g e n g l e i c h , d.h. s y m m e t r i s c h . E r ist n u t variabel als G e s a m t G C - G e h a l t d e r DNS ( z w i s c h e n 25 und 75%). E n t s p r e c h e n d e s gilt f(ir A d e n i n und Thymin (AT). Bei j e d e r b e l i e b i g e n B a s e n h ~ u f i g k e i t s v e r t e i l u n g i s t s o m i t die S u m m e yon A+T bzw. G+C i m Doppel-

fang der 60er Jahre wurde mittels quantenmechanischer Berechnungen gezeigt, dab ver~nderte Nachbar-

symmet rische a: Verteilung

schaftsbeziehungen zu unterschiedlichen Wechselwir-

T A T A G C C G AT C G A T T A G C AT C G GC C G G C

kungsenergien der Gene fGhren (DeVoe und Tinooo 1962; Hoffmann und Ladik 1964). Diese sind in Dinukleotiden dann a m gr68ten, wenn gleiche B a s e n k o m p o nenten tibereinanderliegen, z.B. A A

b:

oder TT. Sie

sind wesentlioh kleiner, wenn sioh eine Pyrimidinunter einer Purin-Base befindet (Ladik 1972). W e n n auoh die quantenmechanisohen Berechnungen solcher

asymmetrische Verteilung G C AT C G AT G C AT G C T A C G AT AT G C G C C G

komplizierten Molek(ile quantitativ nioht sehr zuverl~ssig sind, beweisen sie mindestens qualitativ einen gewichtigen Unterschied der Wechselwirkungsenergie bei versohiedener Anordnung der Basen l~ngs der

-•

Kette und damit eine unterschiedliche Stabilit~t versohiedener Nukleotidtexte (Wolkenstein 1969). In der vorliegenden Albeit werden die Verschiedenheifer, i m A s y m m e t r i e g r a d der Basenverteilungen eukaryotischer Nukleotidtexte auf Grund bekannten experimentellen Materials beschrieben. Mittels stati-

~T

1.3 1.3

1.3

!.3

1.3

1.3

1

1

1

1

1.3

0.75

1

1

1

1

0.4

2.5

Abb. 1. Darstellung symmetrischer und a s y m m e trischer Basenverteilungen anhand zweier fiktiver D N S - S e g m e n t e (je 14 B a s e n p ~ r e ; 6 A T und 8 G C ) d = doppelstr~ngige D N S ; c = codogener Strang; k = komplement~rer Strang

R . P i e c h o c k i , W. B e r g and A. B e r g m a n n : A s y m m e t r i s c h e B a s e n v e r t e i l u n g in e u k a r y o t i s c h e n Genen

strang stets identisch mit den S u m m e n

in jedem der

beiden Einzelstr~inge. Bezfiglich der H~iufigkeit einzelner Basen kbnnen aber codogener und komplement~rer Strang a s y m m e -

267

T a b e l l e 1. t J b e r s i o h t fiber die fiir die s t a t i s t i s c h e n A n a l y s e n v e r w e n d e t e n P r o t e i n f a m i l i e n mit den yon Dayhoff (1972) b e r e c h n e t e n E v o t u t i o n s r a t e n (n = A n zahl d e r a k z e p t i e r t e n P u n k t m u t a t i o n e n bei P r o t e i n e n , b e z o g e n auf 100 A m i n o s ~ i u r e r e s t e und 100 M i l l i o n e n Jahre)

trisch sein (Abb. 1). Bei gleicher H~iufigkeit im Doppelstrang k6nnen die Einzelstr~nge yon einer idealen

Proteine

G[eichverteilung ~symmetrisch,

Histon IV Glycerinaldehyd- 3-P hosphat-D ehydrogenase Cytochrom c Insulin Trypsi nogen Encephalitogenes Protein der MyelinMembran Tierisches Lysozym P ancreastrypsin-lnhibitor

Beispiel a) rnehr

oder weniger stark abweiohen, so dab der codogene Strang z.B. purinreioh wird (Beispiel b). Art und Ausma~3 der A s y m m e t r i e l~Bt sich dutch die Quotienten C + T / G + A

und A + C / G ~ T

quantitativ beschrei-

ben. Bei einer symmetrischen Verteilung der Basen (Beispiel a) sind beide Quotienten sowohl im Doppelstrang als auch in den Einzelstr~ngen stets 1. Ein Abweichen yore Wert 1 im codogenen und damit auoh im komp[ement~ren Strang ist ein exaktes M a ~

fiir

asymmetrische Basenverteilung im Oen. t~berwiegt die Pyrimidin/Purin-Asymmetrie, G+A

dann weicht C + T/

stirker von I a b als A + C / G + T ,

6-Aminobasen/6-Ketobasen-Asymmetrie,

iiberwiegt die

n

Myoglobin H~imoglobin-Ketten Lactalbumin Immunglobu[ine Kappa-Kette C-Region Kappa-Kette V-Region Gamma-Kette C-Region Gamma-Kette V-Region Pancreas-Ribonuclease Wachstumshormon

0.06 2 3 4 5 7 I0 11 13

14 25 32 39 33 31 27 33 37

dannist es

umgekehrt. t e i n f a m i l i e n und a n d e r e r s e i t s wegen d e r fast e i n d e u t i gen Z u o r d n u n g s m S g l i c h k e i t e n n u r die 1. und 2. T r i 3. K o r r e l a t i o n e n zwischen Basenh~iufigkeiten und

p l e t t p o s i t i o n e n b e r f i c k s i c h t i g t w o r d e n si n d . Soweit m S g -

Evolutionsraten

l i c h w u r d e n yon j e d e r d e r in Tab. 1 aufgeftihrten P r o teinfamilien mindestens

In e i n e r f r i i h e r e n A r b e i t konnte b e r e i t s f e s t g e s t e l l t

5 V e r t r e t e r fiir d i e s t a t i s t i -

sche Analyse benutzt. D as K o r r e l a t i o n s v e r h a l t e n d e r D N S - B a s e n - H ~ i u f i g -

w e r d e n , dab z w i s c h e n den gesch~itzten d u r c h s c h n i t t l i c h e n DNS-Basenh~iufigkeiten in G e n e n und den E v o l u -

k e i t m i t den E v o l u t i o n s r a t e n w u r d e sowohl g e t r e n n t

tionsraten verschiedener Proteinfamilien strenge Kor-

ffir 1. b z w . 2. T r i p l e t t p o s i t i o n e n a l s auch z u s a m m e n

relationen existieren (Pieehoeki 1976).

fs

Dabei wurde von den bekannten Aminos~iuresequen-

1. + 2. P o s i t i o n e n u n t e r s u c h t .

D a d u r c h ,,vurde

d e u t l i c h , mit w e l c h e r G e w i c h t i g k e i t die e i n z e l n e n P o -

zen ausgegangen (Dayhoff 1972). Die Sch~tzung der Ba-

s i t i o n e n in den Codonen z u m K o r r e l a t i o n s v e r h a l t e n

senh~ufigkeit basierte wegen der Degeneration des Co-

beitragen.

des auf den Durchschnittshiufigkeiten der Basen in den

In A b b . 2 sind fiir die 4 Baser, d i e E r g e b n i s s e d e r

]eweils m6glichen Codonen. F~r die ersten beiden Tri-

Analysen dargestel~t. Tabelle 2 enth~It die zugehSri-

plettpositionen ist mit A u s n a h m e von Leucin, Arginin

gen Schnittpunkte der Geraden mit der Ordinate (a),

und Serin in der I. Position sowie Serin in der 2. Po-

die Regressionskoeffizienten (by/x). sowie die Korre-

sition eine eindeutige Zuordnung der D N S - B a s e n m 6 g -

lationskoeffizienten (r).

lieh. Bei den mehrdeutigen ZuordnungsmSglichkeiten

Aus Tab. 3 ist zu entnehmen, dab yon den 6 m6gli-

in den genannten 1. und 2. und pr~ktisch allen 3. Po-

chert Zweierkombinationen der Basen die Purine bzw.

sitionen wurde der Durchschnittswert bei A n n a h m e

die Pyrimidine das st~irkste Korrelationsverhalten zeigen.

gleicher H~iufigkeit der 6,4 bzw.

2 Codonen verwen-

det, eine dort m6gliche Selektion also vorerst nicht beriicksichtigt. In dieser Arbeit wird das Ergebnis einer detzillierteren Analyse mitgeteilt, bei der einerseits m e h r Pro-

Auf Grund der detaillierten Analyse des Korrelationsverhaltens der Basen in der I. und 2. Triplettposition kann gezeig~ werden, d~% die st~rksten positiven Korrelationstendenzen Adenin in der 1. und Gua-

268

T h e o r . A p p l . G e n e t . 49 (1977)

%C

I

i

J

%T

i

I

I

I

L 30

T a b e l l e 3. Q u a n t i t a t i v e C h a r a k t e r i s i e r u n g d e r K o r r e lation d e r 6 m b g l i c h e n B a s e n k o m b i n a t i o n e n mi t den E v o l u t i o n s r a t e n d e r G e n p r o d u k t e ( S y m b o l e wie in Tab. 2 ) DNS-Basen

20

rl. =-0.19

"-.....

rt -- 0.,50 10 _ r2 ' --0~Sl rI~2.- * 0.75

'~,,

r2. - 0.09 r1~.2.- -GO6

Thymin

Cytosin %G

I 10

I 20

I

I

Purine Pyrimidine 6-Ketobasen 6-Aminobasen AT-Basenpaare GC-Basenpaare

[ 30 PAMs

%AI

1

os

3(~

~''

I 10

I 20

I

I

G+A C +T G +T A +C A +T G +C

a

by/x

r

42,78 57, 19 51,33 48, 65 49, 54 50,48

+0,262 -0,261 +0,129 -0,129 +0,084 -0,086

+0,592 -0,594 +0,467 -0,468 +0,203 -0,211

I 30 PAMs I

Tabelle 4. Quantitative Charakterisierung des unterschiecllichen Korrelationsverhaltens yon Adenin und Guanin in den ersten und zweiten Positionen der Codonen (Symbole wie in Tab. 2)

3(] DNS-Basen in 1. Position

2. Position

a

by/x

r

A +G G A

40,19 45,38 39,38 46,21

+0,252 +0,272 +0,477 +0,046

+0,440 +0,509 +0,531 +0,083

20

20

A +G 10

10

A G

Adenin

Guanin I 10

= 0.42 r2. =-oil ri..2 .- 0.36

rt

rl. =0.13 r2. =0.44 r1~- 0.45

I 20

l 10

I 30 PAMs

I 20

I 30 PAMs

nin in d e r 2. P o s i t i o n z e i g e n , was a l l e i n auf K o s t e n

1.und 2.Positionen der Codonen 1. 2.

9 9

q M

von C y t o s i n g e s c h i e h t , d as sowohl in d e r 1. a l s auch

Abb. 2. Korrelation zwischen den Evolutionsraten der Proteine ( P A M s ) und den H~iufigkeiten der 4 D N S - B a s e n in den entsprechenden Genen. P A M = Anzahl der akzeptierten Punktmutationen bei Proteinen, bezogen auf I00 Aminos~urereste und I00 Millionen Jahre; r = Korrelationskoeffizient

in d e r 2. P o s i t i o n s t a r k n e g a t i v k o r r e l i e r t (Tab. 2 ) . Um d i e s e a u f f a l l e n d e T a t s a c h e w e l t e r zu b e l e g e n , w u r de das K o r r e l a t i o n s v e r h a l t e n d e r K o m b i n a t i o n yon A + G in den e r s t e n b e i d e n T r i p l e t t p o s i t i o n e n u n t e r ~ suoht ( T a b . 4 ) . D a r a u s geht h e r v o r , dab in d e r e r s t e n P o s i t i o n Adenin und in d e r z w e i t e n P o s i t i o n G u a -

T a b e l l e 2. Q u a n t i t a t i v e C h a r a k t e r i s i e r u n g d e r K o r r e l a t i o n d e r D N S - B a s e n - H ~ i u f i g k e i t e n m it den E v o l u t i o n s raten der Genprodukte a

by/x

r

I. 2. 1.+2.

33,96 22,38 28,18

-0,174 -0,311 -0,242

-0,497 -0,613 -0,747

Thymin

1. 2. 1.+2.

25,82 32,19 29,03

-0,082 +0,035 -0,023

-0,187 +0,092 -0,064

Adenin

1. 2. 1.+2.

17,49 23,49 20,47

+0,202 -0,003 +0,101

+0,421 -0,112 +0,364

Guanin

I. 2. 1.+2.

22,71 21,88 22,30

+0,050 +0,276 +0,164

+0,132 +0,447 +0,454

Cytosin

D i e s e K o m b i n a t i o n k o r r e l i e r t a m st~irksten mi t den E v o l u t i o n s r a t e n d e r P r o t e i n e , w~ihrend di e u m g e -

TriplettPosition

DNS-Base

nin a n t a g o n i s t i s c h z u m C y t o s i n w i r k e n .

a - Schnittpunkt mit der y-Achse, b y / x - Begressionskoeffizient, r - Korrelationskoeffizient

k e h r t e K o m b i n a t i o n (1. P o s i t i o n G + 2 . P o s i t i o n A) fiberhaupt k e i n e s y s t e m a t i s o h e n V e r i i n d e r u n g e n a n z e i g t ( v g l . d i e b e i d e n l e t z t e n Z e i l e n yon Tab. 4 ) .

4. Art und A u s m a B der A s y m m e t r i e In Abb. 1 w u r d e d e m o n s t r i e r t , dab d i e Q u o t i e n t e n C + T / G +A und A + C / G +T g e e i g n e t s i n d , d a s A u s mab d e r A s y m m e t r i e zu c h a r a k t e r i s i e r e n .

Di e A b -

w e i c h u n g e n yon 1, d i e fiir den c o d o g e n e n S t r a n g b e rechnet wurden, sind quantitativer Ausdruck a s y m m e t r i s c h e r B a s e n v e r t e i l ung.

R. P i e c h o c k i , W. B e r g und A . B e r g m a n n : A s y m m e t r i s c h e B a s e n v e r t e i l u n g in e u k a r y o t i s c h e n G en en

In A b b . 3 i s t ffir d ie B a s e n h ~ u f i g k e i ~ d e r 1. + 2. P o s i t i o n e n d as AusmaB d e r A s y m m e t r i e d a r g e s t e l l t .

269

g e t die E v o l u t i o n s r a t e n d e r P r o t e i n e sind, u m so st~irk e r i st die A s y m m e t r i e ausgepr~igt. Die P r o t e i n e mi t

F fir den Q u o t i e n t e n C + T / G + A e r g e b e n s i c h s y s t e m a -

g e r i n g e r E v o l u t i o n s r a t e w e r d e n yon Genen c o d i e r t ,

t i s c h e A b w e i c h u n g e n yon e i n e r Z u f a l l s v e r t e i l u n g ,

d i e r e l a t i v v i e l C in den 1. und 2. T r i p l e t t p o s i t i o n e n

w~ihrend s i c h d i e W e r t e ffir den Q u o t i e n t e n A + C /

enthalten, welches mit zunehmender Evolutionsrate

G + Tum

in d e r 1. P o s i t i o n v o r w i e g e n d d u r c h A, in d e r 2. P o -

den ffir e i n e z u f ~ l l i g e V e r t e i l u n g zu e r w a r -

tenden Wert 1 g r u p p i e r e n .

s i t i o n v o r w i e g e n d d u r c h G e r s e t z t i s t . D i e s e s Ph~ino-

Um die s y s t e m a t i s c h e n A b w e i c h u n g e n zu q u a n t i f i -

m en i s t g l e i c h b e d e u t e n d mit e i n e r A b n a h m e g l e i c h a r -

z i e r e n , w u r d e m it H i l f e e i n e s s p e z i f i s c h e n I t e r a t i o n s -

t i g e r B a s e n in d e r 1. und 2. P o s i t i o n : w~ihrend di e

v e r f a h r e n s der Punktewolke eine Exponentialfunktion

Gene n i e d r i g e v o l v i e r e n d e r P r o t e i n e h~iufiger C C

Y = a 0 + ale'tX nach der Methode der kleinsten Quad r a t e angepaBt.

(und i m k o m p l e m e n t ~ i r e n S t r a n g G G) a u f w e i s e n , sind d i e j e n i g e n hoch e v o l v i e r e n d e r P r o t e i n e h~iufiger d u t c h

D a r a u s i s t a b z u l e i t e n , dab ffir d i e b e o b a c h t e t e n

A in d e r 1. und G in d e r 2. P o s i t i o n a u s g e z e i c h n e t .

K o r r e l a t i o n e n die P y r i m i d i n / P u r i n - A s y m m e t r i e

ver-

antwortlich ist.

W e c h s e l w i r k u n g e n bei u n t e r s c h i e d l i c h e n D N S - B a s e n N a c h b a r s c h a f t e n in D i n u k l e o t i d e n ( W o l k e n s t e i n 1969)

o-,| C+T

A*C

M i t t e l s q u a n t i t a t i v e r Daten fiber d i e e n e r g e t i s c h e n

I

I

I

1

l a s s e n s i c h in e r s t e r N~iherung die A u s w i r k u n g e n auf die B a s e n w e c h s e l w i r k u n g e n in d i e s e n Genen b e r e c h -

"

nen. D i e e x a k t e n W e r t e s o l l e n in e i n e r f o l g e n d e n A r -

2.5~..

r-~: 't32* 126e~'13X .~: Y" 1"06-0005e*O'031

belt m i t g e t e i l t w e r d e n . Aus ihnen e r g i b t s i c h , dab die unterschiedlichen K o r r e l a t i o n s t e n d e n z e n der einz e l n e n B a s e n bei P r o t e i n e n m i t n i e d r i g e r E v o l u t i o n s -

211

r a t e zu m a x i m a l e n , bei s o l c h e n m i t h o h e r E v o l u t i o n s r a t e zu m i n i m a l e n B a s e n - W e c h s e l w i r k u n g e n in den k o r r e s p o n d i e r e n d e n Genen ffihren. U r s a c h e daffir i s t die h i e r b e s c h r i e b e n e T a t s a c h e , dab mit z u n e h m e n d e r

1.5

E v o l u t i o n s r a t e die W a h r s c h e i n l i c h k e i t ffir g l e i c h a r t i ge B a s e n in 1. und 2. P o s i t i o n abnimrnt ( v g l . E i n l e i t u n g ) . Dabei muB b e r f i c k s i c h t i g t w e r d e n , dab s i c h tO -

-

_

_:

:

t

~":-:9

d i e s e e r h e b l i c h e n U n t e r s c h i e d e ohne die 3. T r i p l e t t position, also nur mit einem Drittel der unmittelbaren Nachbarschaftsbeziehungen, ergeben.

l 10

I 20

I 30

i 40 PAMs

Abb. 3. D a r s t e l l u n g d e r B e z i e h u n g z w i s c h e n E v o l u t i o n s r a t e n d e r P r o t e i n e ( P A M s , v g l . A b b . 2 ) und d e m A u s m a B d e r A s y m m e t r i e in den e n t s p r e c h e n d e n G e n e n . C T / G A ffir P y r i m i d i n / P u r i n - A s y m m e t r i e ( P u n k t e und d u r c h g e z o g e n e K u r v e ) ; A C / G T ffir 6 - A m i n o / 6 - K e t o b a s e n - A s y m m e t r i e ( K r e u z e und g e s t r i c h e l t e Linie)

In d e r E i n l e i t u n g w u r d e d a r a u f h i n g e w i e s e n , dab der Nachweis der Wirkungslosigkeit e i n e r Mutation auf S t r u k t u r und F u n k t i o n von P r o t e i n e n a l l e i n ni c ht a u s r e i c h t , s i e ffir s e l e k t i o n s n e u t r a l zu erkl~iren, s o l an g e d e r EinfluB auf die I n t e r a k t i o n yon DNS und Proteinen,

auf die T r a n s k r i p t i o n s e f f e k t i v i t ~ i t , di e

T r a n s l a t i o n und d i e Mutabilit~t d e r G e n e nicht bekannt i s t . Mit a n d e r e r Methodik w u r d e k f i r z l i c h g e z e i g t , dab auch in den D N S - S e q u e n z e n d e r Gene ffir C y t o c h r o m c

5. Diskussion

die P y r i m i d i n / P u r i n - A s y m m e t r i e

mit s t e i g e n d e r O r -

g a n i s a t i o n s h b h e d e r O r g a n i s m e n z u n i m m t ( M a z i n 1975). E s k o n n t e g e z e i g t w e r d e n , dab z w i s c h e n den E v o l u -

E i n e a u s f f i h r l i c h e D i s k u s s i o n fiber d i e B e d e u t u n g d e r

t i o n s r a t e n yon P r o t e i n e n und d e m A u s m a B a s y m m e -

a u f g e f u n d e n e n A s y m m e t r i e n ffir e i n e o d e r m e h r e r e d i e -

t r i s c h e r B a s e n v e r t e i l u n g in den e n t s p r e c h e n d e n Genen

s e r E b e n e n e r s c h e i n t ohne K e n n t n i s tier v o l l s t A n d i g e n

ein s y s t e m a t i s c h e r Z u s a m m e n h a n g b e s t e h t . J e n i e d r i -

DNS-Sequenzen verfrtiht. Die P r o b l e m a t i k soll a b e t

270

Theor. Appl. Genet. 49 (1977)

w e n i g s t e n s an m 6 g l i c h e n K o n s e q u e n z e n fiir d i e M u t a -

samte Spektrum der Proteinfamilien verteilt zu er-

bilit~it d e r Gene s k i z z i e r t w e r d e n .

warten, nicht in Korrelation mit den Evolutionsraten.

DaB v e r s o h i e d e n e Gene u n t e r s c h i e d i i c h s t a r k m u -

Die Gene yon Histonen, Glycerinaldehyd-3-Phos-

t i e r e n (StacUer 1930), dab s o g a r v e r s c h i e d e n e A l l e l e

phat-Dehydrogenase und Cytochrom c weisen die

e i n e s G e n e s bedingt d u r c h i h r e u n t e r s c h i e d l i c h e G e n -

st~rksten A s y m m e t rien und dadurch eine Maximierung

struktur unterschiedliche Mutationsraten aufweisen

der Wechselwirkungen zwisohen den Basen auf. Da-

( T i r n o f & e f f - B e s s o v s k y 1932), w u r d e b e r e i t s zu B e -

f~ir k6nnen zwei Hypothesen diskutiert werden:

ginn d e r e x p e r i m e n t e l l e n M u t a t i o n s f o r s c h u n g d e m o n striert.

D r e i B i g J a h r e sp~iter k o n n t e auf m o l e k u l a -

I. Selektion auf niedrige Mutabilit~t. Diese drei Proteine sind an biochemisohen Reaktionen beteiligt,

r e i n N i v e a u g e z e i g t w e r d e n , dab die G e n s t r u k t u r e l -

die ft~r alle Eukaryoten nahezu identisch und essen-

hen e n t s c h e i d e n d e n Einfluh auf d i e Mutabilit~it haben

tiell sind. Es handelt sich u m sehr alte Proteine, die

kann. Koch (1971) b e w i e s e x p e r i m e n t e l l , dab eine

offenbar in Funktion und Struktur weitgehend opti-

N u k l e o t i d s u b s t i t u t i o n d ie Mutabilit~it d e r N a c h b a r b a s e

miert sind. Daher ist es ~uBerst unwahrscheinlich,

um ein V i e l f a c h e s ( b i s zu 23fach) ver~indern kann.

dab neu auftretende Mutationen in den entsprechen-

E s s o l l t e d e s h a l b u n t e r s c h i e d e n w e r d e n , dab e i n e Mutation (Basensubstitutien) a) f u n k t i o n s n e u t r a l s e i n kann, wenn s i e z um A u s -

den Genen zu einer weiteren Optimierung beitragen k6nnen. Bestimmte Prozesse der Genregulation, der Atmungskette und des Citratzyklus sind so fundamen-

t a u s c h e i n e r Aminos~iure f ii h r t , d i e O e s a m t s t r u k t u r

tal wichtig und angepaBt, dab jede neue Mutation, die

und F u n k t i o n d es P r o t e i n s a b e r nicht n a c h w e i s b a r

diese Funktionen betrifft, zu einer Belastung der Po-

ver~ndert,

pulation fiihren wGrde. Eine Beduktion der spontanen

b) strukturneutral sein kann, wenn sie zu einem Codon f(ir die gleiche Aminos~ure fdhrt. In keinem Fall ist aber bis dahin erwiesen, dab sie wirklioh c) selektionsneutral ist. Zumindest eine grobe Selektion der Mutabilit~t

Mutabilit~it durch selektierte Maximierung der W e c h s e l w i r k u n g e n z w i s c h e n b e n a c h b a r t e n B a s e n k6nnte zu einer Verminderung der Mutationslast einer Population fiihren. 2. P r ~ i f e r e n t i e l l e Mutabilit~it. E s i st zu e r w a r t e n , dab die St~irke d e r W e c h s e l w i r k u n g e n b e n a c h b a r t e r

m u g a priori erwartet werden, da sowohl zu hohe M u -

B a s e n d e r e n A u s t a u s c h b a r k e i t beeinfluBt. D a s h~itte

tabilit~t (wegen der Mutationsbelastung der Popula-

z u r F o l g e , dab s i c h d u r c h Mutationen iiber l a n g e Z e i t -

tion) als auch zu niedrige (wegen eventueller Beein-

r~iume i m R a h m e n d es b i o c h e m i s c h - f u n k t i o n e l l M b g -

tr~chtigung der genetischen Variabilit~it) nachteilig

l i c h e n (ph~inotypische S e l e k t i o n ) i m m e r s t a b i l e r e B a -

w~re (Dobzhansky 1970).

senzusammensetzungen ergeben, solange keine Selek-

Dennooh wird die Mutabilit~t nicht als ratendeterminierender Faktor der Evolution angesehen. Unterschiedliche Evolutionsraten von Proteinen werden aus-

tion d a g e g e n w i r k t . D as w / r e um so st~irker a u s g e pr~igt, j e ~ilter die P r o t e i n e s i n d . B e s o n d e r s H y p o t h e s e (2) enth~ilt r e l a t i v s t r e n g e

schlieSlich duroh die Selektion a m Ph~notyp verstan-

E r w a r t u n g e n fiir die B a s e n d e r 3. T r i p l e t t p o s i t i o n e n ,

den und zwar so, dab Ver~nderungen an sehr alien

deren bedingte Wahrscheinlichkeiten im Zusarnmen-

und funktionsoptimierten Proteinen fast nie, an jun-

hang m i t den v o r a u f g e h e n d e n und f o l g e n d e n ( 2. und 1 .)

gen und nicht mit der gesamten Aminos~urekette funk-

B a s e n a b e t e r s t an vollst~indig s e q u e n t i e r t e n Genen

tionsspezifisohen Proteinen abet h~ufiger toleriert

iiberpriift w e r d e n kbnnen.

werden kSnnen. Die oben beschriebenen systematischen Ver~nderungen im A u s m a b der A s y m m e t r i e in den Basense-

W e l c h e t h e o r e t i s c h e n Deutungen d i e s e a s y m m e t r i s c h e n B a s e n v e r t e i l u n g e n s c h l i e B l i o h auch e r f a h r e n w e r d e n , s i e s t i i t z e n d i e A u s s a g e ( P i e o h o c k i 1976),

quenzen lassen sich aber dadurch nicht erkl~ren. Z w a r

dab die H~iufigkeit d e r e i n z e l n e n Aminos~iuren in den

w~ren untersohiediiohe Asymmetriegrade in Genen

P r o t e i n e n nicht und auch n i ch t v o r w i e g e n d a l s Z u f a l l s -

verschiedener Proteine dutch zuf~llige Fixierung

v e r t e i l u n g e n e n t s p r e o h e n d d e r A n z a h l i h r e r Codonen

funktions- oder strukturneutraler Mutationen m 6 g -

zu v e r s t e h e n i s t . Dab d i e s b e z i i g l i c h e K a l k u l a t i o n e n

lich, sie w~ren dann abet auoh zuf~llig iiber das ge-

s o l c h e m E r g e b n i s karnen und e s a l s A r g u m e n t fiir

zu

R. P i e c h o c k i , W. B e r g und A. B e r g m a n n : A s y m m e t r i s c h e B a s e n v e r t e i l u n g in e u k a r y o t i s c h e n G e n e n Theorien "neutraler" Mutationen verwendet wurde, erkl~irt s i c h d a r a u s , dab P r o t e i n e mit n i e d r i g e r und h o h e r E v o l u t i o n s r a t e e n t g e g e n g e s e t z t yon e i n e r Z u f a l l s v e r t e i l u n g a b w e i c h e n und s o m i t d e r D u r c h s c h n i t t s wert aller P r o t e i n f a m i l i e n z u s a m m e n g e n o m m e n eine s o l c h e vort~iuscht ( v g l . King und J u k e s 1969). Bei u m f a n g r e i c h e r e n Analysen lassen sich signifikante A b w e i c h u n g e n e i n z e l n e r A m i n o s ~ i u r e n auch d u r c h die M i t t e l w e r t b i l d u n g fiber s t a t i s t i s c h h e t e r o g e n e P r o t e i n f a m i l i e n nicht m e h r v e r m e i d e n ( v g l . J u k e s et a l . 1975), ohne a l l e r d i n g s den z u g r u n d e l i e g e n d e n s y s t e m a t i s c h e n Z u s a m m e n h a n g e r k e n n e n zu l a s s e n .

Literatur A r n h e i m , N. ; T a y l o r , C h . E . : N o n - D a r w i n i a n e v o l u t i o n : C o n s e q u e n c e s for n e u t r a l a l l e l i c v a r i a t i o n . N a t u r e 223, 900-903 (1969) B e n z e r , S. :--'~n the t o p o g r a p h y of the g e n e t i c fine s t r u c t u r e . P r o c . N a t l . A c a d . Sci. U . S . 47, 403415 (1961) Benzer, S. ; Freese, E. : Induction of specific mutations with 5-bromouracil. Proc. Natl. Acad. Sci. U . S . 44, 112-119 (1958) C l a r k e , B. : D a r w i n i a n e v o l u t i o n of p r o t e i n s . S c i e n c e 168, 1009-1011 (1970) Dayhoff, M . O . ( E d . ) : A t l a s of P r o t e i n S e q u e n c e and S t r u c t u r e . Vol. 5. W a s h i n g t o n D . C . : National B i o m e d i c a l R e s e a r c h F o u n d a t i o n 1972 D o b z h a n s k y , T. : G e n e t i c s of the E v o l u t i o n a r y P r o c e s s . New Y o r k , London: C o l u m b i a U n i v e r s i t y P r e s s 1970 H o f f m a n n , T . A . ; Ladik, J . (1964) zit. nach Ladik 1972 J u k e s , T . H . ; H o l m q u i s t , It. ; M o i s e , H. : A m i n o a c i d c o m p o s i t i o n of p r o t e i n s : S e l e c t i o n a g a i n s t the g e n e t i c c o d e . S c i e n c e 189, 50-51 (1975) K i m u r a , M. : E v o l u t i o n a r y r a t e at the m o l e c u l a r l e v e l . N a t u r e 217, 624-626 (1968a)

Received 31.1.77 C o m m u n i c a t e d by R. H a g e m a n n

271

K i m u r a , M. : G e n e t i c v a r i a b i l i t y m a i n t a i n e d in a f i n i t e population due to m u t a t i o n a l p r o d u c t i o n of n e u t r a l and n e a r l y n e u t r a l i s o a l l e l e s . G e n e t . I r e s . l ! , 247-

269 (1968b) Kimura, M. ; Ohta, T. : Protein polymorphism as a phase of molecular evolution. Nature 229, 467-

469 (1971) K i m u r a , M. ; Ohta, T. : On s o m e p r i n c i p l e s g o v e r n ing m o l e c u l a r e v o l u t i o n . P r o c . Natl. A c a d . Sci. U.S. 71, 2848-2852 (1974) King, J . L . ; Jukes, T.H. : Non-Darwinian evolution. S c i e n c e 164, 788-798 (1969) Koch, R . E . : The i n f l u e n c e of n e i g h b o r i n g b a s e p a i r s upon b a s e - p a i r s u b s t i t u t i o n m u t a t i o n r a t e s . P r o c . N a t l . A c a d . Sci. U.S. 68, 773-776 (1971) Ladik, J . : Q u a n t e n b i o c h e m i e ffir C h e m i k e r und B i o l o g e n . S t u t t g a r t : F . E n k e 1972 L a i r d , C h . D . ; McConaughy, B . L . ; M c C a r t h y , B . J . : Rate of fixation of n u c l e o t i d e s u b s t i t u t i o n s in e v o l u t i o n . N a t u r e 224, 149-154 (1969) M a z i n , A . L . : E v o l u t i o n of DNA s t r u c t u r e : D i r e c t i o n , mechanism, rate. (russ.) Molekuljarnaja Biologij a 9 ( 2 ) , 252-274 (1975) P i e c h o c k i , It. : C o r r e l a t i o n b e t w e e n e s t i m a t e d a v e r age f r e q u e n c i e s of D N A - b a s e s of g e n e s and e v o l u t i o n a r y r a t e s of c o r r e s p o n d i n g p r o t e i n s . Studia b i o p h y s i c a 58, 51-62 (1976) Richmond, B . C . : Non-Darwinian evolution: A c r i t i q u e . N a t u r e 225, 1025-1028 (1970) S i n g e r , C . E . ; A m e s , B . N . : Sunlight u l t r a v i o l e t and b a c t e r i a l DNA b a s e r a t i o s . S c i e n c e 170, 822-826

(1970) Stadler, L.J. : The frequency of mutation of specific enes in maize. (Abstract) Anat. ReG. 47, 381

f 1930)

Sueoka, N. : Correlation between base composition of deoxyribonucleic acid and amino acid composition of protein. Proc. Natl. Acad. Sci. U.S. 47, 11411149 (1961) Timof&eff-Ressovsky, N . W . : Verschiedenheit der "normalen" Allele der white-Serie aus zwei geographisch getrennten Populationen yon Drosophila melanogaster. Biol. Zbl. )52, 468-476 (1932) DeVoe, H. ; Tinooo, I. (1962 -~t. nach Wolkenstein 1969 W o l k e n s t e i n , N . W . : Molekdle und Leben. Leipzig: G. T h i e m e 1969

R. Piechocki Wissenschaftbereich Genetik Sektion Biowissenschaften Martin-Luther - Universit~it Halle-Wittenberg DDIt-401 Halle/Saale Domplatz 1 G e r m a n D e m . Itep.

[The extent of asymmetric distribution of DNA-bases in genes].

The correlation between the evolutionary rates of proteins and frequencies of DNA-bases in the first and in the second position of corresponding codon...
607KB Sizes 1 Downloads 0 Views