Annotations of OMRGCv2_11223010.136

Genomic Sequence ⬇️ DNA sequence in FASTA format
Origin Westerlies Biome : [MS] Mediterranean Sea : : [MEDI] Mediterranean Sea, Black Sea Province TARA_009_DCM_0.22-1.6
GPS: 39.0609,5.9422
Sampled on 2009-09-28 at 16:59:00
Filtered to: 0.22-1.6 microns
Depth: 55m (Sea floor: m)
Temperature: 15.9708°C
Length 1149 bp
Status coding
ORF [400 - 1092/1149] indirect strand
Translation
>OMRGCv2_11223010 Translation [400-1092   indirect strand]
MHTVLAQTDYVGISFWFVSAALLAATAFFFLERGTVSNKWKTSLTVAGLVTGIAFWHYLYMRGMWIETGESPNVYRYIDWLLTVPLLIVEFYLILKAVTT
VRVAIFYKLLIGSIVMLVAGYMGEAGLAPVLPAFVVGMAAWLYIIYEIFAGETAKANSSSGNEAAQTAYSAMKWIVTIGWVIYPAGYFLGYLTGGGVDAN
SLNLIYNLADFVNKILFGLVIFAAAVKDSNA
Polypeptide size

231 aa - kDa

ORF finding

PROTOCOLE:


 

a. SMS ORF finder / http://annotathon.org/sms2/orf_find.html/ sens direct / cadre 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'bacterial'.

 

b. SMS ORF finder / http://annotathon.org/sms2/orf_find.html/ sens indirect / cadre 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'bacterial'
 

C . SMS ORF finder / http://annotathon.org/sms2/orf_find.html/ sens indirect / cadre 1 / min 60 AA / initiation 'atg, gtg, ctg, ttg' / code génétique 'bacterial'.

ANALYSE DES RÉSULTATS:


 

Table 1 : Liste des ORFs détectés dans le fragment d'ADN métagénomique

  Taille (nuclĂ©otides) Taille (aa) Brin Position de dĂ©but Position de fin  ORF complet en 5' ORF complet en 3'   Nb d'alignements BLAST
Refseq_protein EV<1E-10
Classification de l'ORF
ORF 1 210 69 Direct 468 677  Oui Oui  0  Faux Positif
ORF 2 696 231 Indirect 400 1095  Oui  Oui  1022 KNOWN (ORF Ă©tudiĂ©e ici)

 

 

Figure 1 : Diagramme de répartition des ORFs sur le fragment d'ADN TO72D_5186010


                                  (468)======ORF1======>(677)  
DIRECT :     1 ------------------------------------------------------------------------------ 1149
INDRECT : 1149 ------------------------------------------------------------------------------ 1
             (1095)<====================================ORF2===================(400)
Légende :

==ORFx==> Faux positif
==ORFx==> KNOWN (ORF Ă©tudiĂ©e ici)

 

L'ORF 2 est codant, L'ORF 1 est un faux positif, je vais analyser en dĂ©tails L'ORF 2 situĂ© sur le brin indirect, il possède des homologues avec des fonctions connues (1022 d'après Refseq_protein) et il est assez long (231 aa). 
 

 


BLAST

PROTOCOLE :

 

a. BLASTp ORF2 contre RefSeq_prtoein / https://blast.ncbi.nlm.nih.gov/Blast.cgi? PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome# / paramètres par défaut. sauf 'Number of descriptions =5000". exclude 'Uncultured/environmental sample sequences' et 'Expect threshold=10'.

b. BLASTp ORF2 contre swissprot / https://blast.ncbi.nlm.nih.gov/Blast.cgi? PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome# / paramètres par défaut. sauf 'Number of descriptions =5000". exclude 'Uncultured/environmental sample sequences'et 'Expect threshold=10'.

 


ANALYSE DES RÉSULTATS:


Table 2 : Nombre et qualité des alignements détectés par BLASTp contre Refseq_protein et SWISSPROT

 

 Nombre de protĂ©ines alignĂ©es

E-value min

E-value max

E-value seuil

 
 

 

RefSeq_Protein

1553

7,00E-102

9,9

4,00E-7

 

 

 

 

 swissprot

7

2,00E-104

5.9

1,00E-7

 

 

 

 


Table 3 : Catalogue des fonctions des protéines alignées par BLASTp contre Refseq_protein

Définitions

Nb lines

Min E-value

Max E-value

bacteriorhodopsin-like

843

7,00E-102

4.9

bacteriorhodopsin

648

3,00E-84

9.9

hypothetical protein

21

8,00E-14

5.1

rhodopsin

2

5,00E-07

1,00E-06

sensory rhodopsin II

26

3,00E-06

2.5

family A G protein-coupled receptor-like protein

2

0.003

0.041

sensory rhodopsin III

5

0.037

0.21

microbial rhodopsin family protein

3

0.098

4.7

uncharacterized protein

1

3.8

3.8

unnamed protein product

1

4.8

4.8

TetR family transcriptional regulator

1

8.7

8.7

 

 

Après avoir cherché dans les ressources de NCBI il me semble que les définitions "rhodopsin", "family A G protein-coupled receptor-like protein" et "microbial rhodopsin family" issu de la table 3 désignerait la même chose sous des noms différents (https://www.ncbi.nlm.nih.gov/Structure/sparcle/archview.html? archid=11606509) je vais donc les recoupé sous l'appellation " sensory rhodopsin I". Je vais retirer les protéines hypothétiques, les non nommées et les non caractérisées afin d'obtenir une version simplifiée de la table 3.

 

Table 4 : Version simplifié du catalogue des fonctions des protéines alignées par BLASTp contre Refseq_protein

Définitions

Nb lignes

Min E-value

Max E-value

bacteriorhodopsin-like

843

7,00E-102

4.9

bacteriorhodopsin

648

3,00E-84

9.9

sensory rhodopsin I

7

5,00E-07

4.7

sensory rhodopsin II

26

3,00E-06

2.5

sensory rhodopsin III

5

0.037

0.21

TetR family transcriptional regulator

1

8.7

8.7


Les fonctions "bacteriorhodopsin-like" et "bacteriorhodopsin» me semble assez proche (https://www.ncbi.nlm.nih.gov/genome/annotation_prok/evidence/NF013223/ et https://www.ncbi.nlm.nih.gov/Structure/sparcle/archview.html?archid=11607111) pour que je les considère comme synonyme. En revanche les fonctions "sensory rhodopsin I", "sensory rhodopsin II" et "sensory rhodopsin III" qui sont homologue entres elles, mĂŞme si leur fonction ne semble pas trop Ă©loignĂ©e du groupe arbitraire "bacteriorhodopsin-bacteriorhodopsin-like", elles diffèrent suffisamment couplĂ© au fait que cela concerne peu de hit avec souvent des E valeur Ă©levĂ©, et que ce sont des sĂ©quences peu ou mal annotĂ© notamment sur la fonction de la protĂ©ine. Je choisis donc de les exclure via la E-valeur seuil, quitte Ă  exclure quelques homologues je suis ainsi sĂ»r de ne pas prendre de sĂ©quences non-homologue pour la suite.  Ce qui fait donc une E-valeur seuil de 4e-7 pour l'alignement contre Refseq_protein et 1e-7 pour swissprot. Ce qui nous permet aussi d'exclure "TetR family transcriptional regulator" qui est un non-homologue car sa fonction n’a rien Ă  voir et son E valeur est très Ă©levĂ©.
Au vu de ces éléments je suppose que L'ORF 2 code pour une protéine du type bacteriorhodopsine-like.

 



Taxonomy report

PROTOCOLE:


 

BLASTp ORF2 contre RefSeq_prtoein / https://blast.ncbi.nlm.nih.gov/Blast.cgi? PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome# / paramètres par défaut. sauf 'Number of descriptions =5000". exclude 'Uncultured/environmental sample sequences' et 'Expect threshold=10'.

 

Rapport taxonomique: http://annotathon.org/outils/blast_tax_report2.php

 

Synthèse taxonomique : http://annotathon.org/outils/blast_taxonomy_list.php

 

ANALYSE DES RÉSULTATS:


 

Table 5 : Synthèse des classifications taxonomiques des protéines alignées par BLASTp contre Refseq_protein

 

Classification Nb lines Nb hits Min E-value Max E-value Max Score Min Score
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Candidatus Pelagibacterales 12 63 7,00E-102 5,00E-86 305 264
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Maricaulales 2 10 3,00E-96 7,00E-87 290 266
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:SAR116 cluster 1 1 2,00E-89 2,00E-89 274 274
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Hyphomicrobiales 64 123 7,00E-86 5.1 264 38.9
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:PS1 clade 1 2 2,00E-76 2,00E-76 241 241
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Rhodospirillales 4 10 1,00E-54 0.56 184 42.7
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Rhodobacterales 23 39 1,00E-27 4.4 115 40.0
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Sphingomonadales 82 162 5,00E-26 9.2 111 39.3
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Caulobacterales 4 22 1,00E-23 2,00E-20 105 97.1
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria:Parvularculales 4 9 2,00E-21 2.2 100 41.2
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Oceanospirillales 12 23 2,00E-98 9,00E-21 295 98.2
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Vibrionales 16 46 6,00E-98 3,00E-17 294 88.2
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Alteromonadales 16 24 3,00E-95 1,00E-81 288 256
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Moraxellales 1 1 2,00E-86 2,00E-86 267 267
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Cellvibrionales 7 15 2,00E-86 3,00E-80 265 251
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Candidatus Comchoanobacterales 1 2 2,00E-85 2,00E-85 263 263
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Candidatus Thioglobus 2 14 9,00E-78 1,00E-73 243 233
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Candidatus Pseudothioglobus 2 14 2,00E-74 6,00E-74 235 234
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria 1 1 2,00E-73 2,00E-73 232 232
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Thiotrichales 1 1 7,00E-27 7,00E-27 114 114
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Xanthomonadales 1 3 1,00E-26 1,00E-26 113 113
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Legionellales 4 14 1,00E-26 4,00E-23 113 104
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Pseudomonadales 8 18 9,00E-26 8,00E-23 111 103
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Chromatiales 18 45 2,00E-25 0.001 110 50.4
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria:Salinisphaerales 1 2 5,00E-25 5,00E-25 109 109
LUCA:Bacteria:Proteobacteria:Betaproteobacteria:Burkholderiales 17 41 2,00E-97 4,00E-13 294 73.2
LUCA:Bacteria:Proteobacteria:Betaproteobacteria:Nitrosomonadales 5 80 3,00E-93 2,00E-12 283 75.5
LUCA:Bacteria:Proteobacteria:Acidithiobacillia:Acidithiobacillales 1 3 2,00E-24 2,00E-24 107 107
LUCA:Bacteria:Verrucomicrobia:Opitutae:Puniceicoccales 2 3 1,00E-99 1,00E-19 300 94.7
LUCA:Bacteria:Bacteroidetes 376 835 4,00E-62 1,6 204 41,6
LUCA:Bacteria:Planctomycetes 6 10 3,00E-30 5,00E-11 122 72
LUCA:Bacteria:Bacillota 58 167 4,00E-30 5 122 39,7
LUCA:Bacteria:Actinobacteria 252 556 1,00E-28 7,2 118 38,9
LUCA:Bacteria:Cyanobacteria:Cyanophyceae 18 25 4,00E-22 8,2 102 39,3
LUCA:Bacteria:Deinococcota:Deinococci: 38 63 4,00E-20 2,00E-04 96.3 53.1
LUCA:Bacteria:Rhodothermaeota:Rhodothermia:Rhodothermales 9 44 9,00E-13 0.17 76.6 44.3
LUCA:Bacteria:Chloroflexi: 12 52 9,00E-13 0.17 76.6 44.3
LUCA:Bacteria:Balneolaeota:Balneolia:Balneolales 10 20 3,00E-08 0.002 63.9 50.1
LUCA:Archaea:Euryarchaeota:Stenosarchaea group:Halobacteria 91 204 1,00E-06 9.3 58.9 38.9
LUCA:Eukaryota: 5 13 5,00E-05 3.8 54.7 40.4


I.

Il semblerait que la sĂ©quence soit issue d'une Alphaproteobacteria plus prĂ©cisĂ©ment une Candidatus Pelagibacterales, je choisis donc ce dernier taxa comme groupe d'Ă©tude il possède une E valeur de 7E-102 et donc le groupe d'Ă©tude extĂ©rieur sera l'ensemble des Alphaproteobacteria sauf les Candidatus Pelagibacterales. Le groupe extĂ©rieur possède une E valeur de 3E-96 au mieux et donc le meilleur hit du groupe d'Ă©tude Ă  une E valeur de 8 ordres de grandeurs en dessous du groupe extĂ©rieur. NĂ©anmoin les meilleurs hits d'autre groupe taxonomique extĂ©rieur aux alphaprotĂ©obactĂ©ries sont: Gammaproteobacteria2,00E-98 ; Betaproteobacteria 2,00E-97 ;  et surtout Verrucomicrobia 1,00E-99 qui n'est mĂŞme pas une Proteobacteria.
Avec de tel valeur on pourrait envisager d'autres analyse en prenant par exemple en groupe d'Ă©tude l'ensemble des Alphaproteobacteria en groupe extĂ©rieur l'ensemble Gammaproteobacteria-Betaproteobacteria ce qui permettrait de situer la sĂ©quence plus prĂ©cisĂ©ment entre ces trois taxa, ou encore en groupe d'Ă©tude l'ensemble des Proteobacteria contre l'ensemble des bacteria non Proteobacteria ce qui confirmerait ou infirmerai l'appartenance de la sĂ©quence au Proteobacteria .

Groupe d’étude :

>BPACPC1  E-value=7e-102  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_075502192.1 bacteriorhodopsin-like [Candidatus Pelagibacter ubique]
>BPACPC2  E-value=1e-99  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_271542271.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp.]
>BPACPC3  E-value=3e-99  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_085147276.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp. RS39]
>BPACPC4  E-value=6e-99  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_075534100.1 bacteriorhodopsin-like [Candidatus Pelagibacter ubique]
>BPACPC5  E-value=6e-98  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_085068854.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp. RS40]
>BPACPC6  E-value=2e-97  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_008544914.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp. HTCC7211]
>BPACPC7  E-value=7e-96  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_085113892.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp. HIMB1321]
>BPACPC8  E-value=1e-95  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_006997279.1 MULTISPECIES: bacteriorhodopsin-like [Candidatus Pelagibacter]
>BPACPC9  E-value=7e-95  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_011281819.1 bacteriorhodopsin-like [Candidatus Pelagibacter ubique]
>BPACPCP1  E-value=8e-95  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter;Pelagibacter sp. NP1; WP_168606621.1 bacteriorhodopsin-like [Candidatus Pelagibacter giovannonii]
>BPACPC10  E-value=1e-87  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_013695533.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp. IMCC9063]
>BPACPC11  E-value=5e-86  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacterales incertae sedis;Candidatus Fonsibacter; WP_099340517.1 bacteriorhodopsin-like [Candidatus Fonsibacter ubiquis]

 

Groupe extérieur :
>BPAMMM1  E-value=3e-96  Bacteria;Proteobacteria;Alphaproteobacteria;Maricaulales;Maricaulaceae;Maricaulis; WP_291920389.1 bacteriorhodopsin-like [Maricaulis sp.]
>BPAMRHH1  E-value=7e-87  Bacteria;Proteobacteria;Alphaproteobacteria;Maricaulales;Robiginitomaculaceae;Hellea;Hellea sp.; WP_272042501.1 bacteriorhodopsin-like [Hellea sp.]
>BPASC1  E-value=2e-89  Bacteria;Proteobacteria;Alphaproteobacteria;SAR116 cluster;Candidatus Puniceispirillum; WP_013046996.1 bacteriorhodopsin-like [Candidatus Puniceispirillum marinum]
>BPAHRT1  E-value=2e-50  Bacteria;Proteobacteria;Alphaproteobacteria;Hyphomicrobiales;Rhodovibrionaceae;Tistlia; WP_085123257.1 bacteriorhodopsin [Tistlia consotensis]
>BPARPY1  E-value=1e-27  Bacteria;Proteobacteria;Alphaproteobacteria;Rhodobacterales;Paracoccaceae;Yoonia; WP_213396016.1 bacteriorhodopsin [Yoonia sp.]
>BPARPTT1  E-value=6e-25  Bacteria;Proteobacteria;Alphaproteobacteria;Rhodobacterales;Paracoccaceae;Tabrizicola;Tabrizicola sp. WMC-M-20; WP_135515210.1 bacteriorhodopsin-like [Tabrizicola sp. WMC-M-20]
>BPARRP1  E-value=7e-25  Bacteria;Proteobacteria;Alphaproteobacteria;Rhodobacterales;Roseobacteraceae;Palleronia; WP_198917734.1 bacteriorhodopsin-like [Tranquillimonas pontilimi]
>BPASSS1  E-value=5e-26  Bacteria;Proteobacteria;Alphaproteobacteria;Sphingomonadales;Sphingomonadaceae;Sphingomonas; WP_133187805.1 bacteriorhodopsin-like [Sphingomonas sp. AAP5]


II.

Dans la partie « II Â» et ce pour la suite des analyse sous cette banière on considèrera le groupe d'Ă©tude comme Ă©tant l'ensemble des Proteobacteria et le groupe extĂ©rieur sera l'ensemble des bactĂ©ria non Proteobacteria. L'hypothèse que je cherche Ă  tester est la supposĂ© appartenance de la sĂ©quence au Proteobacteria.
Cette série d'analyse complémentaire est motivé par la E valeur très élevé de V
errucomicrobia 1,00E-99 qui est supérieur à la E valeur des Betaproteobacteria ainsi que celle des Gammaproteobacteria alors que ce n'est même pas une Proteobacteria.
Le groupe extĂ©rieur possède une E valeur de 1,00E-99 au mieux et donc le meilleur hit du groupe d'Ă©tude 7,00E-102 Ă  une E valeur de 3 ordres de grandeurs en dessous du groupe extĂ©rieur.


Groupe d’étude :
>BPACPC1 E-value=7e-102 Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_075502192.1 bacteriorhodopsin-like [Candidatus Pelagibacter ubique]
>BPACPC2 E-value=1e-99 Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_271542271.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp.]
>BPAMMM1 E-value=3e-96 Proteobacteria;Alphaproteobacteria;Maricaulales;Maricaulaceae;Maricaulis; WP_291920389.1 bacteriorhodopsin-like [Maricaulis sp.]
>BPASC1 E-value=2e-89 Proteobacteria;Alphaproteobacteria;SAR116 cluster;Candidatus Puniceispirillum; WP_013046996.1 bacteriorhodopsin-like [Candidatus Puniceispirillum marinum]
>BPGOOO1 E-value=2e-98 Proteobacteria;Gammaproteobacteria;Oceanospirillales;Oleiphilaceae;Oleiphilus; WP_068502023.1 MULTISPECIES: bacteriorhodopsin-like [unclassified Oleiphilus]
>BPGOSR1 E-value=3e-83 Proteobacteria;Gammaproteobacteria;Oceanospirillales;Saccharospirillaceae;Reinekea; WP_273285472.1 bacteriorhodopsin-like [Reinekea forsetii]
>BPGVVP1 E-value=6e-98 Proteobacteria;Gammaproteobacteria;Vibrionales;Vibrionaceae;Paraphotobacterium; WP_089073889.1 bacteriorhodopsin-like [Paraphotobacterium marinum]
>BPGAAOA1 E-value=3e-95 Proteobacteria;Gammaproteobacteria;Alteromonadales;Alteromonadaceae;Opacimonas;Alteromonas sp. LMIT007; WP_254100510.1 bacteriorhodopsin-like [Opacimonas viscosa]
>BPGVVV1 E-value=6e-95 Bacteria;Proteobacteria;Gammaproteobacteria;Vibrionales;Vibrionaceae;Vibrio; WP_009599924.1 bacteriorhodopsin-like [Vibrio caribbeanicus]
>BPGAAG1 E-value=1e-90 Proteobacteria;Gammaproteobacteria;Alteromonadales;Alteromonadaceae;Glaciecola; WP_010179136.1 bacteriorhodopsin-like [Glaciecola sp. HTCC2999]
>BPGAAAA1 E-value=2e-87 Proteobacteria;Gammaproteobacteria;Alteromonadales;Alteromonadaceae;Alteromonas/ Salinimonas group;Alteromonas; WP_239060085.1 MULTISPECIES: bacteriorhodopsin-like [Alteromonas]
>BPGCHH1 E-value=2e-85 Proteobacteria;Gammaproteobacteria;Cellvibrionales;Halieaceae;Halioglobus; WP_084197851.1 bacteriorhodopsin-like [Halioglobus japonicus]
>BPGCHAH1 E-value=3e-84  Bacteria;Proteobacteria;Gammaproteobacteria;Cellvibrionales;Halieaceae;Aequoribacter;Halieaceae bacterium IMCC3088; WP_050793460.1 bacteriorhodopsin [Aequoribacter fuscus]
>BPBBBPP1  E-value=2e-97 Proteobacteria;Betaproteobacteria;Burkholderiales;Burkholderiaceae;Polynucleobacter;Polynucleobacter paneuropaeus; WP_215278723.1 bacteriorhodopsin-like [Polynucleobacter paneuropaeus]
>BPBBBP1 E-value=6e-96 Proteobacteria;Betaproteobacteria;Burkholderiales;Burkholderiaceae;Polynucleobacter; WP_096672020.1 bacteriorhodopsin-like [Polynucleobacter meluiroseus]
>BPBBCR1 E-value=6e-96 Proteobacteria;Betaproteobacteria;Burkholderiales;Comamonadaceae;Rhodoferax; WP_293661354.1 bacteriorhodopsin-like [Rhodoferax sp. OV413]
>BPBBCP1 E-value=2e-93 Proteobacteria;Betaproteobacteria;Burkholderiales;Comamonadaceae;Polaromonas; WP_168923445.1 bacteriorhodopsin-like [Polaromonas vacuolata]
>BPBNMC1 E-value=3e-93 Proteobacteria;Betaproteobacteria;Nitrosomonadales;Methylophilaceae;Candidatus Methylopumilus; WP_045750668.1 bacteriorhodopsin-like [Candidatus Methylopumilus turicensis]
>BPAAAA1 E-value=2e-24 Proteobacteria;Acidithiobacillia;Acidithiobacillales;Acidithiobacillaceae;Acidithiobacillus; WP_287684960.1 bacteriorhodopsin-like [Acidithiobacillus sp.]

Groupe extérieur :

>BVOPPCC1 E-value=1e-99 Verrucomicrobia;Opitutae;Puniceicoccales;Puniceicoccales incertae sedis;Candidatus Pelagisphaera;Candidatus Pelagisphaera phototrophica; WP_283394222.1 bacteriorhodopsin-like [Candidatus Pelagisphaera phototrophica]
>BBCCCCC1 E-value=4e-62 Bacteroidetes;Cytophagia;Cytophagales;Cyclobacteriaceae;Cyclobacterium;Cyclobacterium sp. SYSU L10401; WP_163381470.1 bacteriorhodopsin-like [Cyclobacterium sp. SYSU L10401]
>BBCCCBB1 E-value=8e-62 Bacteroidetes;Cytophagia;Cytophagales;Cyclobacteriaceae;Belliella;Belliella sp. DSM 107340; WP_241273390.1 bacteriorhodopsin-like [Belliella calami]
>BBCCSR1 E-value=6e-61 Bacteroidetes;Cytophagia;Cytophagales;Spirosomaceae;Runella; WP_114069376.1 bacteriorhodopsin-like [Runella rosea]
>BBFFFFF1 E-value=3e-58 Bacteroidetes;Flavobacteriia;Flavobacteriales;Flavobacteriaceae;Flavobacterium;Flavobacterium lacustre; WP_269684351.1 bacteriorhodopsin-like [Flavobacterium lacustre]
>BPCCCCC1 E-value=3e-30 Planctomycetes;Candidatus Uabimicrobiia;Candidatus Uabimicrobiales;Candidatus Uabimicrobiaceae;Candidatus Uabimicrobium;Candidatus Uabimicrobium amorphum; WP_151969421.1 bacteriorhodopsin [Candidatus Uabimicrobium amorphum]
>BBBBBE1 E-value=4e-30 Bacillota;Bacilli;Bacillales;Bacillales Family XII. Incertae Sedis;Exiguobacterium; WP_214837567.1 MULTISPECIES: bacteriorhodopsin-like [Exiguobacterium]
>BBBBBA1 E-value=5e-28 Bacillota;Bacilli;Bacillales;Bacillaceae;Alkalicoccus; WP_026697097.1 bacteriorhodopsin [Alkalicoccus chagannorensis]
>BAAMOOO1 E-value=5e-21 Actinobacteria;Actinobacteria;Micrococcales;Ornithinimicrobiaceae;Ornithinimicrobium;Ornithinimicrobium sediminis; WP_269812948.1 bacteriorhodopsin-like [Ornithinimicrobium sediminis]
>BAAPNN1 E-value=9e-23 Actinobacteria;Actinobacteria;Propionibacteriales;Nocardioidaceae;Nocardioides; WP_056603809.1 bacteriorhodopsin-like [Nocardioides sp. Soil774]
>BRRRSS1 E-value=9e-13 Rhodothermaeota;Rhodothermia;Rhodothermales;Salinibacteraceae;Salinibacter; WP_259045864.1 bacteriorhodopsin-like [Salinibacter ruber]
>BRRRSS2 E-value=8e-11 Rhodothermaeota;Rhodothermia;Rhodothermales;Salisaetaceae;Salisaeta; WP_022834939.1 bacteriorhodopsin-like [Salisaeta longa]
>BCCCRRR1 E-value=2e-10 Chloroflexi;Chloroflexia;Chloroflexales;Roseiflexineae;Roseiflexaceae;Roseiflexus; WP_011957674.1 bacteriorhodopsin [Roseiflexus sp. RS-1]
>BBBBBHB1 E-value=6e-09 Balneolaeota;Balneolia;Balneolales;Balneolaceae;Halalkalibacterium (ex Wu et al. 2022);Balneolaceae bacterium YR4-1; WP_249066744.1 bacteriorhodopsin-like [Halalkalibaculum roseum]

 

III.

Dans la partie "III." des analyse je vais supposer la sĂ©quence comme appartenant au Alphaproteobacteria, ce sera donc notre groupe d'Ă©tude. Le groupe extĂ©rieur sera donc constituĂ© du groupement Betaproteobacteria-Gammaproteobacteria, dut Ă  la proximitĂ© taxonomique de ces deux phyla. Le groupe extĂ©rieur possède une E valeur de 2E-98 au mieux et donc le meilleur hit du groupe d'Ă©tude 7,00E-102 Ă  une E valeur de 4 ordres de grandeurs en dessous du groupe extĂ©rieur.

 

Groupe d'étude :

>BPACPC1  E-value=7e-102  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_075502192.1 bacteriorhodopsin-like [Candidatus Pelagibacter ubique]

>BPACPC2  E-value=6e-98  Bacteria;Proteobacteria;Alphaproteobacteria;Candidatus Pelagibacterales;Pelagibacteraceae;Candidatus Pelagibacter; WP_085068854.1 bacteriorhodopsin-like [Candidatus Pelagibacter sp. RS40]

>BPAMMM1  E-value=3e-96  Bacteria;Proteobacteria;Alphaproteobacteria;Maricaulales;Maricaulaceae;Maricaulis; WP_291920389.1 bacteriorhodopsin-like [Maricaulis sp.]

>BPASC1  E-value=2e-89  Bacteria;Proteobacteria;Alphaproteobacteria;SAR116 cluster;Candidatus Puniceispirillum; WP_013046996.1 bacteriorhodopsin-like [Candidatus Puniceispirillum marinum]

>BPAHRT1  E-value=2e-50  Bacteria;Proteobacteria;Alphaproteobacteria;Hyphomicrobiales;Rhodovibrionaceae;Tistlia; WP_085123257.1 bacteriorhodopsin [Tistlia consotensis]

>BPAHRR1  E-value=6e-28  Bacteria;Proteobacteria;Alphaproteobacteria;Hyphomicrobiales;Roseiarcaceae;Roseiarcus; WP_245427424.1 bacteriorhodopsin [Roseiarcus fermentans]

>BPAHAM1  E-value=6e-27  Bacteria;Proteobacteria;Alphaproteobacteria;Hyphomicrobiales;Aurantimonadaceae;Martelella; WP_024706642.1 bacteriorhodopsin [Martelella sp. AD-3]

>BPAPC1  E-value=2e-76  Bacteria;Proteobacteria;Alphaproteobacteria;PS1 clade;Candidatus Micropelagos; WP_021777124.1 bacteriorhodopsin-like [Candidatus Micropelagos thuwalensis]

>BPARAS1  E-value=0.56  Bacteria;Proteobacteria;Alphaproteobacteria;Rhodospirillales;Acetobacteraceae;Swaminathania; WP_147093221.1 bacteriorhodopsin [Swaminathania salitolerans]

>BPARPTT1  E-value=6e-25  Bacteria;Proteobacteria;Alphaproteobacteria;Rhodobacterales;Paracoccaceae;Tabrizicola;Tabrizicola sp. WMC-M-20; WP_135515210.1 bacteriorhodopsin-like [Tabrizicola sp. WMC-M-20]

>BPARRP1  E-value=7e-25  Bacteria;Proteobacteria;Alphaproteobacteria;Rhodobacterales;Roseobacteraceae;Palleronia; WP_198917734.1 bacteriorhodopsin-like [Tranquillimonas pontilimi]

>BPASSS1  E-value=5e-26  Bacteria;Proteobacteria;Alphaproteobacteria;Sphingomonadales;Sphingomonadaceae;Sphingomonas; WP_133187805.1 bacteriorhodopsin-like [Sphingomonas sp. AAP5]

>BPASSS2  E-value=3e-23  Bacteria;Proteobacteria;Alphaproteobacteria;Sphingomonadales;Sphingomonadaceae;Sphingorhabdus; WP_295491514.1 bacteriorhodopsin-like [Sphingorhabdus sp. EL138]

>BPASEEE1  E-value=2e-22  Bacteria;Proteobacteria;Alphaproteobacteria;Sphingomonadales;Erythrobacteraceae;Erythrobacter/ Porphyrobacter group;Erythrobacter; WP_067613938.1 bacteriorhodopsin-like [Erythrobacter sp. QSSC1-22B]

>BPACCB1  E-value=1e-23  Bacteria;Proteobacteria;Alphaproteobacteria;Caulobacterales;Caulobacteraceae;Brevundimonas; WP_183213804.1 bacteriorhodopsin-like [Brevundimonas variabilis]

 

Groupe extérieur:

 

>BPGOOO1  E-value=2e-98  Bacteria;Proteobacteria;Gammaproteobacteria;Oceanospirillales;Oleiphilaceae;Oleiphilus; WP_068502023.1 MULTISPECIES: bacteriorhodopsin-like [unclassified Oleiphilus]

>BPGOSR1  E-value=3e-83  Bacteria;Proteobacteria;Gammaproteobacteria;Oceanospirillales;Saccharospirillaceae;Reinekea; WP_273285472.1 bacteriorhodopsin-like [Reinekea forsetii]

>BPGVVP1  E-value=6e-98  Bacteria;Proteobacteria;Gammaproteobacteria;Vibrionales;Vibrionaceae;Paraphotobacterium; WP_089073889.1 bacteriorhodopsin-like [Paraphotobacterium marinum]

>BPGAAG1  E-value=1e-90  Bacteria;Proteobacteria;Gammaproteobacteria;Alteromonadales;Alteromonadaceae;Glaciecola; WP_010179136.1 bacteriorhodopsin-like [Glaciecola sp. HTCC2999]

>BPGCHH1  E-value=2e-86  Bacteria;Proteobacteria;Gammaproteobacteria;Cellvibrionales;Halieaceae;Halioglobus; WP_066053965.1 bacteriorhodopsin-like [Halioglobus sp. HI00S01]

>BPGCHH2  E-value=2e-85  Bacteria;Proteobacteria;Gammaproteobacteria;Cellvibrionales;Halieaceae;Halioglobus; WP_084197851.1 bacteriorhodopsin-like [Halioglobus japonicus]

>BPGAAG2  E-value=1e-83  Bacteria;Proteobacteria;Gammaproteobacteria;Alteromonadales;Alteromonadaceae;Glaciecola; WP_006008821.1 bacteriorhodopsin-like [Glaciecola pallidula]

>BPGC1  E-value=6e-74  Bacteria;Proteobacteria;Gammaproteobacteria;Candidatus Pseudothioglobus; WP_053820684.1 bacteriorhodopsin-like [Candidatus Pseudothioglobus singularis]

>BPGCES1  E-value=1e-22  Bacteria;Proteobacteria;Gammaproteobacteria;Chromatiales;Ectothiorhodospiraceae;Spiribacter; WP_016353389.1 bacteriorhodopsin-like [Spiribacter salinus]

>BPBBBPP1  E-value=2e-97  Bacteria;Proteobacteria;Betaproteobacteria;Burkholderiales;Burkholderiaceae;Polynucleobacter;Polynucleobacter paneuropaeus; WP_215278723.1 bacteriorhodopsin-like [Polynucleobacter paneuropaeus]

>BPBBBP1  E-value=6e-96  Bacteria;Proteobacteria;Betaproteobacteria;Burkholderiales;Burkholderiaceae;Polynucleobacter; WP_096672020.1 bacteriorhodopsin-like [Polynucleobacter meluiroseus]

>BPBBCR1  E-value=6e-96  Bacteria;Proteobacteria;Betaproteobacteria;Burkholderiales;Comamonadaceae;Rhodoferax; WP_293661354.1 bacteriorhodopsin-like [Rhodoferax sp. OV413]

>BPBBCPP1  E-value=4e-90  Bacteria;Proteobacteria;Betaproteobacteria;Burkholderiales;Comamonadaceae;Polaromonas;Polaromonas sp. CG_9.11; WP_196869404.1 bacteriorhodopsin-like [Polaromonas sp. CG_9.11]

>BPBNMCC1  E-value=5e-90  Bacteria;Proteobacteria;Betaproteobacteria;Nitrosomonadales;Methylophilaceae;Candidatus Methylopumilus;Candidatus Methylopumilus rimovensis; WP_139873583.1 bacteriorhodopsin-like [Candidatus Methylopumilus rimovensis]

>BPBNMCC2  E-value=2e-89  Bacteria;Proteobacteria;Betaproteobacteria;Nitrosomonadales;Methylophilaceae;Candidatus Methylopumilus;Candidatus Methylopumilus universalis; WP_139867393.1 bacteriorhodopsin-like [Candidatus Methylopumilus universalis]



Multiple Alignement

PROTOCOLE:


I.

http://www.phylogeny.fr / MUSCLE, paramètres par défaut / Gblocks paramètres par défaut

II.
http://www.phylogeny.fr / MUSCLE, paramètres par défaut / Gblocks 'Allow less strict flanking positions'

III.

http://www.phylogeny.fr / MUSCLE, paramètres par défaut / Gblocks paramètres par défaut


ANALYSE DES RÉSULTATS:


 

I.
C'est un Alignement sur 300 positions dont 16 complétement conservées et 65 sont variables mais conservé ( ':' et '.' dans l'affichage clustalw). Les séquences conservées sont réparties sur la totalité de l'alignement, ce qui nous confirme l'homologie entre ces séquences. Les séquences ont des longueurs comparables. Cependant en N-Terminal même si on retrouve un début bien aligné pour quasi toute les séquences, il y a tout de suite après un gap qui peut aller jusqu'à 27 positions, ce gap concerne l'ORF que l'on étudie, mais paradoxalement cela semble plus caractéristique du groupe extérieur que du groupe d'étude qui possède peu ce gap sur ces positions mais plus une séquence conservée. En C-terminale on a une variation de 1 à 16 positions, là pour le coup la séquence étudiée ressemble plus à ses homologues du groupe d'études. Il y a 27 positions avec un gap au milieu des séquences, cependant ils concernent quasiment toutes les séquences à chaque fois. Après curation par Gblocks on a 185 positions soit 61% de l’alignement original.

II.
Cet alignement concerne 338 positions dont 18 complétement conservées et 30 variables mais conservé ( ':' et '.' dans l'affichage clustalw). Les séquences conservées sont globalemennt réparties sur la totalité de l'alignement même si on peut remarquer leur absence totale au début dans le premier bloc et une faible présence dans le dernier bloc. En N-terminal on s'apperçoit d'une grande variation entre 1 et 54 positions pour le départ des séquences, mais cela permet de globalement séparer le groupe d'étude et l'ORF qui commencent à peut pret aux même positions. En C-terminal on observe une première "fin" parfaitement aligné pour toutes les séquences,où s'arrete certaine dont l'ORF, suivi d'un gap de 10 positions puis d'une réelle fin de séquences qui varie de 1 à 17 positions. Il y a environ 67 positions de Gap au milieu des séquences.
Après curation par Gblocks paramétré de manière moins strict on a 117 positions conservé soit 34% de l'Alignement initial
III.

C'est un alignement à 316 positions dont 7 complétements conservés et 37 variables mais conservé (':' et '.' dans l'affichage clustalw). Les séquences conservées sont réparties sur la totalité de l'alignement, ce qui nous confirme l'homologie entre ces séquences. En N-terminal on retrouve 3 positions de départ qui se distinguent : la première est constitué d'une grande majorité de séquence de Betaproteobacteria et quelques une d'Alphaproteobacteria. La seconde position de départ ne concerne quasiment que des Alphaproteobacteria et l'ORF. La troisième position qui ne diffère de la seconde que de 3 positions concerne des Gammaproteobacteria. Cela est très intéressant car on voit émergé les 3 taxa étudiés ici. En C-terminal c'est un peu plus confus on trouve une variation de 1 à 16 positions sur la fin des séquences et on ne voit pas clairement de groupe émerger. Les séquences sont globalement de mêmes longueurs. On retrouve jusqu'à 44 positions de Gap au milieu des séquences. Après curation par Gblocks paramètre par défauts on a 145 positions conservé soit 45% de l'alignement original.

 



Tree

PROTOCOLE:


I.

a. Phylogeny.fr / méthode PhyML / Statistical tests for branch support aLRT: SH-like / default substitution model /groupe d'étude : Candidatus Pelagibacterales / groupe extérieur : Alphaproteobacteria non Candidatus Pelagibcaterales.

b. Phylogeny.fr/ méthode 'ProtDist/FastDist + BioNJ' /'number of bootstraps=1000'/ Substitution model : Jones-Taylor-Thornton matrix / groupe d'étude : Candidatus Pelagibacterales / groupe extérieur : Alphaproteobacteria non Candidatus Pelagibcaterales.
II.

Phylogeny.fr / méthode PhyML / Statistical tests for branch support aLRT: SH-like / default substitution model /groupe d'étude : Proteobacteria / groupe extérieur : Bacteria non Proteobacteria

 

III.

Phylogeny.fr / méthode PhyML / Statistical tests for branch support aLRT: SH-like / default substitution model /groupe d'étude : Alphaproteobacteria/ groupe extérieur : Betaproteobacteria-Gammaproteobacteria


I.a. Arbre 1 par PhylML
Légende de l'arbre :
groupe d'étude : Candidatus Pelagibacterales
sĂ©quence Ă©tudiĂ© :   l'ORF2 
groupe extérieur : Maricaulales, SAR116, Rhodobacterales, Sphingomonadales, Hypomicrobiales
                                                                                                +------------------+ BPARPTT1-E-value6e-25-Rhodobacterales-Paracoccaceae-Tabrizicola (deleted) 
                                                                             +------------------+                                                                                   
                                                          +------------------+ 0.15             +------------------+ BPARRP1-E-value7e-25-Rhodobacterales-Roseobacteraceae-Palleroni
                                                          |                  |                                                                                                      
                                                          |                  +-------------------------------------+ BPASSS1-E-value5e-26-Sphingomonadales-Sphingomonadaceae-Sphingo
                                       +------------------+ 1.00                                                                                                                    
                                       |                G |                  +-------------------------------------+ BPAHRT1-E-value2e-50-Hyphomicrobiales-Rhodovibrionaceae-Tistlia
                    +------------------+ 0.18             +------------------+ 0.99                                                                                                 
                    |                F |                                     +-------------------------------------+ BPARPY1-E-value1e-27-Rhodobacterales-Paracoccaceae-Yoonia-WP-21
                    |                  |                                                                                                                                            
                  D |                  +---------------------------------------------------------------------------+ BPASC1-E-value2e-89-SAR116-cluster-Candidatus-Puniceispirillum 
 +------------------+ 0.77                                                                                                                                                          
 |                  |                                     +--------------------------------------------------------+ BPAMMM1-E-value3e-96-Maricaulales-Maricaulaceae-Maricaulis-WP-2
 |                  |                  +------------------+ 0.99                                                                                                                    
 |                  +------------------+ 0.62             +--------------------------------------------------------+ BPAMRHH1-E-value7e-87-Maricaulales-Robiginitomaculaceae-Hellea 
 |                                   E |                                                                                                                                            
 |                                     +---------------------------------------------------------------------------+ OMRGCv2-11223010-Traduction-400-1092-sens-indirect             
 |                                                                                                                                                                                  
 |                                                                                              +------------------+ BPACPC4-E-value6e-99-Candidatus-Pelagibacterales-Pelagibacterac
 |                                                                           +------------------+ 0.78                                                                              
 |                                                        +------------------+ 0.73             +------------------+ BPACPC5-E-value6e-98-Candidatus-Pelagibacterales-Pelagibacterac
 |                                                        |                  |                                                                                                      
=|                                                        |                  +-------------------------------------+ BPACPC2-E-value1e-99-Candidatus-Pelagibacterales-Pelagibacterac
 |                                                        |                                                                                                                         
 |                                     +------------------+ 0.53                                +------------------+ BPACPC1-E-value7e-102-Candidatus-Pelagibacterales-Pelagibactera
 |                                     |                  |                  +------------------+ 0.54                                                                              
 |                                     |                  +------------------+ 0.84             +------------------+ BPACPC3-E-value3e-99-Candidatus-Pelagibacterales-Pelagibacterac
 |                                     |                                     |                                                                                                      
 |                                   B |                                     +-------------------------------------+ BPACPC6-E-value2e-97-Candidatus-Pelagibacterales-Pelagibacterac
 |                  +------------------+ 0.78                                                                                                                                       
 |                  |                  |                                                        +------------------+ BPACPC7-E-value7e-96-Candidatus-Pelagibacterales-Pelagibacterac
 |                  |                  |                                     +------------------+ 0.69                                                                              
 |                  |                  |                  +------------------+ 0.98             +------------------+ BPACPC9-E-value7e-95-Candidatus-Pelagibacterales-Pelagibacterac
 |                A |                  |                  |                  |                                                                                                      
 +------------------+ 0.95             +------------------+ 0.95             +-------------------------------------+ BPACPC8-E-value1e-95-Candidatus-Pelagibacterales-Pelagibacterac
                    |                                     |                                                                                                                         
                    |                                     +--------------------------------------------------------+ BPACPCP1-E-value8e-95-Candidatus-Pelagibacterales-Pelagibactera
                    |                                                                                                                                                               
                    |                C +---------------------------------------------------------------------------+ BPACPC10-E-value1e-87-Candidatus-Pelagibacterales-Pelagibactera
                    +------------------+ 0.99                                                                                                                                       
                                       +---------------------------------------------------------------------------+ BPACPC11-E-value5e-86-Candidatus-Pelagibacterales-Pelagibactera

Le groupe d'Ă©tude et le groupe extĂ©rieur sont clairement sĂ©parĂ©s sur deux branches distinctes. L'ensemble des sĂ©quences du groupe d'Ă©tudes sont reliĂ©es entre elles par un nĹ“ud extrèmement robuste (nĹ“ud A avec 0,95). Toute les sĂ©quences du groupe extĂ©rieur sont reliĂ©es entre elles par une branche très robuste (Noeud D avec 0.77). Notre ORF se retrouve liĂ©e aux deux sĂ©quences des Maricaulales (BPAMMM1 et BPAMRHH1) dans le groupe extĂ©rieur (nĹ“ud E moyennement robuste avec 0,62).  
La branche reliant toutes les séquences du groupe extérieur sauf les deux séquences de Mauricaulales et l'ORF2, semble peu robuste (nœud F avec 0,18) mais elle met juste en évidence que la place de la séquence BPASC1 n'est pas bien déterminé puisque le nœud suivant (G avec 1,00) est extrêmement robuste et contient le reste des séquences du groupe extérieur. 
Cet arbre semble cohérent avec les arbres des espèces. Une chose que l'on peut remarquer c'est qu'une séquence des Rhodobacterales (BPARPY1) est plus proches d'un Hyphomicrobiales que des autres Rhodobacterales. Après lecture des fiches des séquences il s'avère que BPARPTT1 n'est plus dans la base de données de NCBI, elle a été suprimée noté ici "(deleted)". En retirant cette séquence de l'alignement multiple et donc des arbres cela devrai corriger la séparation curieuse des Rhodobacterales. Cependant comme cela n’a pas d'influence sur la position de l'ORF ou des conclusions que l'on peut tirer de l'arbre, je ne vais pas recommencer en retirant cette séquence.
Il n'y a ici aucune évidence laissant supposer un transfert horizontal : cette hypothèse était basée sur le résultat d'une erreur de maniement de l'Arbre au format Newick de ma part, je l'avais mal enraciné.
Je ne peux pas dire avec certitude que L'ORF appartiennent bien au groupe des Maricaulales à cause de la robustesse du nœud E moyennement robuste avec 0,62. Il me semble difficile de trancher aussi si l'ORF appartient au groupe d'étude ou au groupe extérieur. Cependant au vu de cet arbre la séquence de l'ORF 2 semble bien issues d'une Proteobacteria vu qu'elle s'insère bien au milieu de l'arbre qui en est constitué. Voir même d'une Alphaproteobacteria, mais pour entre sûr il faudrait faire un arbre avec les Gammaproteobacteria et Betaproteobacteria comme groupe extérieur.

 

b. Arbre 2 par BioNJ
Légende de l'arbre :
groupe d'étude : Candidatus Pelagibacterales
sĂ©quence Ă©tudiĂ© :   l'ORF2
groupe extérieur : Maricaulales, SAR116, Rhodobacterales, Sphingomonadales, Hypomicrobiales

                                                                                                +------------------+ BPACPC4-E-value6e-99-Candidatus-Pelagibacterales-Pelagibacterac
                                                                             +------------------+ 0.36                                                                              
                                                          +------------------+ 0.10             +------------------+ BPACPC5-E-value6e-98-Candidatus-Pelagibacterales-Pelagibacterac
                                                          |                  |                                                                                                      
                                                          |                  +-------------------------------------+ BPACPC2-E-value1e-99-Candidatus-Pelagibacterales-Pelagibacterac
                                                          |                                                                                                                         
                                       +------------------+                                     +------------------+ BPACPC1-E-value7e-102-Candidatus-Pelagibacterales-Pelagibactera
                                       |                  |                  +------------------+ 0.76                                                                              
                                       |                  +------------------+ 0.47             +------------------+ BPACPC3-E-value3e-99-Candidatus-Pelagibacterales-Pelagibacterac
                                       |                                     |                                                                                                      
                                       |                                     +-------------------------------------+ BPACPC6-E-value2e-97-Candidatus-Pelagibacterales-Pelagibacterac
                    +------------------+ 0.21                                                                                                                                       
                    |                  |                                                        +------------------+ BPACPC8-E-value1e-95-Candidatus-Pelagibacterales-Pelagibacterac
                    |                  |                                     +------------------+ 0.99                                                                              
                    |                  |                  +------------------+ 0.96             +------------------+ BPACPC9-E-value7e-95-Candidatus-Pelagibacterales-Pelagibacterac
                 J  |                  |                  |                  |                                                                                                      
 +------------------+ 0.53             +------------------+ 0.88             +-------------------------------------+ BPACPC7-E-value7e-96-Candidatus-Pelagibacterales-Pelagibacterac
 |                  |                                     |                                                                                                                         
 |                  |                                     +--------------------------------------------------------+ BPACPCP1-E-value8e-95-Candidatus-Pelagibacterales-Pelagibactera
 |                  |                                                                                                                                                               
 |                  |                  +---------------------------------------------------------------------------+ BPACPC10-E-value1e-87-Candidatus-Pelagibacterales-Pelagibactera
 |                  +------------------+ 1                                                                                                                                          
 |                                     +---------------------------------------------------------------------------+ BPACPC11-E-value5e-86-Candidatus-Pelagibacterales-Pelagibactera
 |                                                                                                                                                                                  
 |                                                                           +-------------------------------------+ BPAHRT1-E-value2e-50-Hyphomicrobiales-Rhodovibrionaceae-Tistlia
=|                                                        +------------------+ 1                                                                                                    
 |                                                        |                  +-------------------------------------+ BPARPY1-E-value1e-27-Rhodobacterales-Paracoccaceae-Yoonia-WP-21
 |                                                        |                                                                                                                         
 |                                     +------------------+ 0.68                                +------------------+ BPARPTT1-E-value6e-25-Rhodobacterales-Paracoccaceae-Tabrizicola (deleted)
 |                                     |                  |                  +------------------+ 0.93                                                                              
 |                                     |                  +------------------+ 1                +------------------+ BPARRP1-E-value7e-25-Rhodobacterales-Roseobacteraceae-Palleroni
 |                  +------------------+ 0.36                                |                                                                                                      
 |                  |                  |                                     +-------------------------------------+ BPASSS1-E-value5e-26-Sphingomonadales-Sphingomonadaceae-Sphingo
 |                  |                  |                                                                                                                                            
 |                H |                  +---------------------------------------------------------------------------+ BPASC1-E-value2e-89-SAR116-cluster-Candidatus-Puniceispirillum 
 +------------------+ 0.82                                                                                                                                                          
                    |                                     +--------------------------------------------------------+ BPAMMM1-E-value3e-96-Maricaulales-Maricaulaceae-Maricaulis-WP-2
                    |                  +------------------+ 1                                                                                                                       
                    +------------------+ 0.78             +--------------------------------------------------------+ BPAMRHH1-E-value7e-87-Maricaulales-Robiginitomaculaceae-Hellea 
                                     I |                                                                                                                                            
                                       +---------------------------------------------------------------------------+ OMRGCv2-11223010-Traduction-400-1092-sens-indirect             
                                                                                                                                                                                    

Dans l'arbre 2 on a ici aussi un groupe d'étude et un groupé extérieur clairement séparés sur deux branches bien distinctes. L’ORF 2 se trouve toujours dans le groupe extérieur. Ici la robustesse des nœuds a été testé par Bootstraps. Le groupe extérieur est relié et séparé en 2 par un nœud assez robuste (nœud H avec 0,82) et L'ORF2 est relié aux Mauricaulales par le nœud I de manière assez robuste lui aussi (avec 0,78). Cependant le groupe d'étude est reliés par un nœud moyennement robuste (nœud J avec 0,53) même si par la suite le groupe d'étude possède en son sein quelque nœud très robuste (1 ; 0,88 ; 0,96), il en possède aussi des très peu robuste (0,10 ; 0,21), ce qui m'interroge sur la fiabilité de cette partie de l'arbre.
Néanmoins cet arbre est plutôt cohérent avec les arbres des espèces.
En se basant uniquement sur cet arbre je pourrais supposer l'ORF 2 appartenir au groupe des Maricaulales puisqu'elle semble en émerger avec une robustesse relative sur les branches correspondantes (nœud I avec 0,78). Ce qui confirmerais donc son appartenance aux Alphaproteobacteria.


II.

Légende de l'arbre :
groupe d'étude : Alphaproteobacteria, Betaproteobacteria, Gammaproteobacteria
sĂ©quence Ă©tudiĂ© :   l'ORF2
groupe extérieur : Bacteroidetes, Actinobacteria, Bacillota, Balneolaeota, Chloroflexi, Planctomycetes, Verrucomicrobia

 

                                      +----------------------------------------------+ BBCCCBB1-E-value8e-62-Bacteroidetes-Cytophagia-Cytophagales-Cyc
                             +--------+ 0.98                                                                                                          
                    +--------+ 0.83   +----------------------------------------------+ BBCCCCC1-E-value4e-62-Bacteroidetes-Cytophagia-Cytophagales-Cyc
                    |        |                                                                                                                        
          +---------+ 0.89   +-------------------------------------------------------+ BBFFFFF1-E-value3e-58-Bacteroidetes-Flavobacteriia-Flavobacteri
          |         |                                                                                                                                 
          |         +----------------------------------------------------------------+ BBCCSR1-E-value6e-61-Bacteroidetes-Cytophagia-Cytophagales-Spir
          |                                                                                                                                           
          |                                                       +------------------+ BAAMOOO1-E-value5e-21-Actinobacteria-Actinobacteria-Micrococcal
          |                                              +--------+ 0.63                                                                              
          |                                     +--------+ 0.95   +------------------+ BAAPNN1-E-value9e-23-Actinobacteria-Actinobacteria-Propionibact
          |                                     |        |                                                                                            
        B |                           +---------+ 0.42   +---------------------------+ BCCCRRR1-E-value2e-10-Chloroflexi-Chloroflexia-Chloroflexales-R
 +--------+ 0.85                      |         |                                                                                                     
 |        |                           |         +------------------------------------+ BBBBBHB1-E-value6e-09-Balneolaeota-Balneolia-Balneolales-Balneo
 |        |                  +--------+ 0.47                                                                                                          
 |        |                  |        |         +------------------------------------+ BRRRSS1-E-value9e-13-Rhodothermaeota-Rhodothermia-Rhodothermale
 |        |         +--------+ 0.58   +---------+                                                                                                     
 |        |         |        |                  +------------------------------------+ BRRRSS2-E-value8e-11-Rhodothermaeota-Rhodothermia-Rhodothermale
 |        |         |        |                                                                                                                        
 |        |         |        +-------------------------------------------------------+ BPAAAA1-E-value2e-24-Proteobacteria-Acidithiobacillia-Acidithio     
 |        +---------+ 0.99                                                                                                                            
 |                  |                 +----------------------------------------------+ BBBBBA1-E-value5e-28-Bacillota-Bacilli-Bacillales-Bacillaceae-A
 |                  |        +--------+ 0.92                                                                                                          
 |                  +--------+ 0.96   +----------------------------------------------+ BBBBBE1-E-value4e-30-Bacillota-Bacilli-Bacillales-Bacillales-Fa
 |                           |                                                                                                                        
 |                           +-------------------------------------------------------+ BPCCCCC1-E-value3e-30-Planctomycetes-Candidatus-Uabimicrobiia-C
 |                                                                                                                                                    
 |                                                       +---------------------------+ BPBBBP1-E-value6e-96-Proteobacteria-Betaproteobacteria-Burkhold
 |                                              +--------+ 0.71                                                                                       
 |                                    +---------+ 0.00   +---------------------------+ BPBBCR1-E-value6e-96-Proteobacteria-Betaproteobacteria-Burkhold
=|                                    |         |                                                                                                     
 |                           +--------+ 0.76    +------------------------------------+ BPBBCP1-E-value2e-93-Proteobacteria-Betaproteobacteria-Burkhold
 |                           |        |                                                                                                               
 |                         D |        +----------------------------------------------+ BPBBBPP1-E-value2e-97-Proteobacteria-Betaproteobacteria-Burkhol
 |                  +--------+ 0.89                                                                                                                   
 |                  |        |        +----------------------------------------------+ BPASC1-E-value2e-89-Proteobacteria-Alphaproteobacteria-SAR116-c
 |                  |        +--------+ 0.85                                                                                                          
 |        +---------+ 0.09            +----------------------------------------------+ BPBNMC1-E-value3e-93-Proteobacteria-Betaproteobacteria-Nitrosom
 |        |       C |                                                                                                                                 
 |        |         |        +-------------------------------------------------------+ BPGAAAA1-E-value2e-87-Proteobacteria-Gammaproteobacteria-Altero
 |        |         +--------+ 0.95                                                                                                                   
 |        |                E +-------------------------------------------------------+ BPGCHAH1-E-value3e-84-Bacteria-Proteobacteria-Gammaproteobacter
 |        |                                                                                                                                           
 |        |                                     +------------------------------------+ BVOPPCC1-E-value1e-99-Verrucomicrobia-Opitutae-Puniceicoccales 
 |        |                           +---------+ 0.46                                                                                                
 |        |                           |       F +------------------------------------+ OMRGCv2-11223010-Traduction-400-1092-sens-indirect             
 |        |                           |                                                                                                               
 |        |                           |                           +------------------+ BPAMMM1-E-value3e-96-Proteobacteria-Alphaproteobacteria-Maricau
 |      A |                         G |                  +--------+ 0.58                                                                              
 +--------+ 0.94             +--------+ 0.27             |        +------------------+ BPGCHH1-E-value2e-85-Proteobacteria-Gammaproteobacteria-Cellvib
          |                  |        |                  |                                                                                            
          |                  |        |         +--------+ 0.78             +--------+ BPGVVP1-E-value6e-98-Proteobacteria-Gammaproteobacteria-Vibrion
          |                  |        |         |        |        +---------+ 0.92                                                                    
          |                  |        |         |        +--------+ 0.79    +--------+ BPGVVV1-E-value6e-95-Bacteria-Proteobacteria-Gammaproteobacteri
          |                  |        +---------+ 0.95            |                                                                                   
          |                  |                 H|                 +------------------+ BPGOOO1-E-value2e-98-Proteobacteria-Gammaproteobacteria-Oceanos
          |         +--------+ 0.92             |                                                                                                     
          |         |        |                  |        +---------------------------+ BPGAAG1-E-value1e-90-Proteobacteria-Gammaproteobacteria-Alterom
          |         |        |                  +--------+ 0.93                                                                                       
          |         |        |                           +---------------------------+ BPGAAOA1-E-value3e-95-Proteobacteria-Gammaproteobacteria-Altero
          +---------+ 0.46   |                                                                                                                        
                    |        |        +----------------------------------------------+ BPACPC1-E-value7e-102-Proteobacteria-Alphaproteobacteria-Candid
                    |        +--------+ 0.93                                                                                                          
                    |                 +----------------------------------------------+ BPACPC2-E-value1e-99-Proteobacteria-Alphaproteobacteria-Candida
                    |                                                                                                                                 
                    +----------------------------------------------------------------+ BPGOSR1-E-value3e-83-Proteobacteria-Gammaproteobacteria-Oceanos

Le groupe d'étude et le groupe extérieur sont clairement séparé, les tout par des nœuds très robuste : le nœud A avec 0,94 de robustesse pour le groupe d'étude et le nœud B avec 0,85 pour le groupe extérieur.

Dans la partie du groupe d'étude on trouve le cas étrange du nœud C qui a une robustesse médiocre de 0,09 malgré le nœud précédent très bon (A) et les deux nœud suivant très robustes aussi D avec 0,89 et E avec 0,95. Je pense que cela vient peut-être du fait que les Alphaproteobacteria les Gammaproteobacteria et les Betaproteobacteria sont complètement mélangé et non pas séparé comme on pourrait s'y attendre, c'est peut-être dû au fait de réalisé un arbre avec beaucoup de séquence issu de phyla bactériens très différent et éloigné qui se base sur un alignement multiple peu probant et dont la sélectivité de la curation par Gblocks a été réduite afin d'avoir suffisamment de positions conservé. Cet arbre est cohérent avec l'arbre des espèces surtout au niveau du groupe extérieur où les différents sous-groupe phylogénétique le composant apparaissent clairement. Pour le groupe d'étude c'est un peu plus compliqué même si on observe une légère séparation dès le nœud A avec d'un côté une majorité de Betaproteobacteria et de l'autre une majorité de Gammaproteobacteria.
On peut observer au milieu du groupe extĂ©rieur se trouve une sĂ©quence du groupe d'Ă©tude BPAAAA1. En regardant sa fiche sur NCBI (https://www.ncbi.nlm.nih.gov/protein/WP_287684960.1/) il ne semble pas y avoir d'erreur, peut ĂŞtre un transfert horizontal ou une erreur de sĂ©quençage. L'ORF est bien dans le groupe d'Ă©tude mais reliĂ© Ă  une sĂ©quence du groupe extĂ©rieur BVOPPCC1 par un nĹ“ud moyennement robuste (F avec 0,46) et la position de cette branche dans l'arbre n'est pas très bonne puisque reliĂ© au nĹ“ud G qui est faiblement robuste avec 0,27 ce dernier ayant une branche qui descend ver le nĹ“ud H fortement robuste avec 0,95 la faible valeur de G est donc bien dut au positionnement de F et donc de notre ORF et de la sĂ©quence BVOPPCC1.

Après plusieurs manipulations de l'enracinement de l'arbre il ne me semble pas que le problème puisse venir de là. La séquence ne semble pas venir d'un projet métagénomique. Après avoir effectué un Blatsp sur cette séquence contre Refseq_prot et utilisé les outils locaux Taxreport et TaxList j'obtiens la table suivante :

 

Table 6 : Synthèse des classifications taxonomiques des protéines homologues à la séquence BVOPPCC1 alignées par BLASTp contre Refseq_protein

Classification nb lines nb hits min E-value max E-value max Score min Score
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria 51 129 1,00E-112 9,00E-78 333 244
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria 18 74 4,00E-109 2,00E-54 324 185
LUCA:Bacteria:Proteobacteria:Betaproteobacteria 17 61 8,00E-104 2,00E-88 312 273
LUCA:Bacteria:Bacteroidetes:Cytophagia 76 135 4,00E-62 5,00E-53 205 182
LUCA:Bacteria:Bacteroidetes:Sphingobacteriia 3 5 7,00E-57 4,00E-54 192 185
LUCA:Bacteria:Bacteroidetes:Saprospiria 4 7 2,00E-56 5,00E-53 191 182
LUCA:Bacteria:Bacteroidetes:Flavobacteriia 23 43 8,00E-55 4,00E-53 186 182

OĂą il apparait que la sĂ©quence est très proche des Proteobacteria, bien plus que les autres taxa et aucune autre sĂ©quence des Verrucomicrobia n'apparait, donc soit nous avons Ă  faire Ă  un Ă©vènement de transfert horizontale très rĂ©cent et surtout assez isolĂ© dans l'histoire Ă©volutive des Verrucomicrobia  (peu probable) ou alors le gĂ©nome des autres espèces concernĂ© n'as pas encore Ă©tĂ© prĂ©levĂ©, sĂ©quencĂ© puis annotĂ© (moyennement probable), soit il s'agit d'une erreur de classification phylogĂ©nĂ©tique de cette sĂ©quence dans la base de donnĂ©es NCBI qui se retrouveras peut ĂŞtre dans quelques temps classĂ© comme une Proteobacteria (probable).

Au vu de cette arbre l'ORF2 m'apparait comme bien appartenant au taxa des Proteobacteria, information Ă  prendre avec des pincettes car il y a peut ĂŞtre un transfert horizontale.

III.
Légende de l'arbre: 
Groupe d'étude: Alphaproteobacteria
séquence étudié: ORF 2
groupe extérieur: Betaproteobacteria-Gammaproteobacteria    



                                                                                 +---------------------------------+ BPBNMCC1-E-value5e-90-Betaproteobacteria-Nitrosomonadales-Methy
                                                                     +-----------+ 0.99                                                                                             
                                                          +----------+ 0.01      +---------------------------------+ BPBNMCC2-E-value2e-89-Betaproteobacteria-Nitrosomonadales-Methy
                                                          |          |                                                                                                              
                                                          |          +---------------------------------------------+ BPBBCPP1-E-value4e-90-Betaproteobacteria-Burkholderiales-Comamo
                                                          |                                                                                                                         
                                               +----------+ 0.88                            +----------------------+ BPBBBP1-E-value6e-96-Betaproteobacteria-Burkholderiales-Burkhol
                                               |          |                      +----------+ 0.00                                                                                  
                                               |          |          +-----------+ 0.76     +----------------------+ BPBBBPP1-E-value2e-97-Betaproteobacteria-Burkholderiales-Burkho
                                               |          |          |           |                                                                                                  
                                   +-----------+ 0.35     +----------+ 0.76      +---------------------------------+ BPASC1-E-value2e-89-Alphaproteobacteria-SAR116-cluster-Candidat
                                   |         E |                     |                                                                                                              
                                   |           |                     +---------------------------------------------+ BPBBCR1-E-value6e-96-Betaproteobacteria-Burkholderiales-Comamon
                                D  |           |                                                                                                                                    
                        +----------+ 0.37      +-------------------------------------------------------------------+ BPGC1-E-value6e-74-Gammaproteobacteria-Candidatus-Pseudothioglo
                        |          |                                                                                                                                                
                        |          |           +-------------------------------------------------------------------+ BPAPC1-E-value2e-76-Alphaproteobacteria-PS1-clade-Candidatus-Mi
                        |          +-----------+ 0.89                                                                                                                               
                        |                      +-------------------------------------------------------------------+ BPGAAG2-E-value1e-83-Gammaproteobacteria-Alteromonadales-Altero
                        |                                                                                                                                                           
                        |                                                                               +----------+ BPGCHH1-E-value2e-86-Gammaproteobacteria-Cellvibrionales-Haliea
                        |                                                                   +-----------+ 0.98                                                                      
                        |                                                        +----------+ 0.03      +----------+ BPGCHH2-E-value2e-85-Gammaproteobacteria-Cellvibrionales-Haliea
            +-----------+ 0.68                                                   |        F |                                                                                       
            |           |                                            +-----------+ 0.69     +----------------------+ BPAMMM1-E-value3e-96-Alphaproteobacteria-Maricaulales-Maricaula
            |           |                                            |           |                                                                                                  
            |           |                                 +----------+ 0.79      +---------------------------------+ BPGAAG1-E-value1e-90-Gammaproteobacteria-Alteromonadales-Altero
            |           |                                 |          |                                                                                                              
            |           |                      +----------+ 0.99     +---------------------------------------------+ BPGOOO1-E-value2e-98-Gammaproteobacteria-Oceanospirillales-Olei
            |           |                      |          |                                                                                                                         
          A |           |          +-----------+ 0.28     +--------------------------------------------------------+ BPGVVP1-E-value6e-98-Gammaproteobacteria-Vibrionales-Vibrionace
 +----------+ 0.83      |          |         G |                                                                                                                                    
 |          |           |        C |           +-------------------------------------------------------------------+ OMRGCv2-11223010-Translation-400-1092-indirect-strand          
 |          |           +----------+ 0.85                                                                                                                                           
 |          |                      |           +-------------------------------------------------------------------+ BPACPC1-E-value7e-102-Alphaproteobacteria-Candidatus-Pelagibact
 |          |                      +-----------+ 0.99                                                                                                                               
 |          |                                  +-------------------------------------------------------------------+ BPACPC2-E-value6e-98-Alphaproteobacteria-Candidatus-Pelagibacte
 |          |                                                                                                                                                                       
 |          +------------------------------------------------------------------------------------------------------+ BPGOSR1-E-value3e-83-Gammaproteobacteria-Oceanospirillales-Sacc
 |                                                                                                                                                                                  
 |                                             +-------------------------------------------------------------------+ BPARPTT1-E-value6e-25-Alphaproteobacteria-Rhodobacterales-Parac
 |                                 +-----------+ 0.85                                                                                                                               
=|                                 |           +-------------------------------------------------------------------+ BPARRP1-E-value7e-25-Alphaproteobacteria-Rhodobacterales-Roseob
 |                                 |                                                                                                                                                
 |                                 |                                             +---------------------------------+ BPACCB1-E-value1e-23-Alphaproteobacteria-Caulobacterales-Caulob
 |                                 |                                 +-----------+ 0.86                                                                                             
 |                      +----------+ 0.95                 +----------+ 0.29      +---------------------------------+ BPASSS2-E-value3e-23-Alphaproteobacteria-Sphingomonadales-Sphin
 |                      |          |                      |          |                                                                                                              
 |                      |          |           +----------+ 0.85     +---------------------------------------------+ BPASEEE1-E-value2e-22-Alphaproteobacteria-Sphingomonadales-Eryt
 |                      |          |           |          |                                                                                                                         
 |          +-----------+ 0.82     +-----------+ 0.87     +--------------------------------------------------------+ BPASSS1-E-value5e-26-Alphaproteobacteria-Sphingomonadales-Sphin
 |          |           |                      |                                                                                                                                    
 |          |           |                      +-------------------------------------------------------------------+ BPGCES1-E-value1e-22-Gammaproteobacteria-Chromatiales-Ectothior
 |        B |           |                                                                                                                                                           
 +----------+ 1.00      +------------------------------------------------------------------------------------------+ BPARAS1-E-value0.56-Alphaproteobacteria-Rhodospirillales-Acetob
            |                                                                                                                                                                       
            |                      +-------------------------------------------------------------------------------+ BPAHAM1-E-value6e-27-Alphaproteobacteria-Hyphomicrobiales-Auran
            |           +----------+                                                                                                                                                
            +-----------+ 0.99     +-------------------------------------------------------------------------------+ BPAHRR1-E-value6e-28-Alphaproteobacteria-Hyphomicrobiales-Rosei
                        |                                                                                                                                                           
                        +------------------------------------------------------------------------------------------+ BPAHRT1-E-value2e-50-Alphaproteobacteria-Hyphomicrobiales-Rhodo
                                                                                                                                                                                    

Dans cet arbre le groupe d'Ă©tude et le groupe extĂ©rieur semble bien se sĂ©parĂ© par des branches très robustes : nĹ“ud A avec 0,83 pour le groupe extĂ©rieur et nĹ“ud B avec 1,00 pour le groupe d'Ă©tude. Puis dans le groupe extĂ©rieur on retrouve une sĂ©paration entre les Betaproteobacteria (nĹ“ud D faiblement robuste 0,37) et les Gammaproteobacteria (nĹ“ud C très robuste 0,85). Cependant quand on regarde en dĂ©tails, on retrouve des sĂ©quences d'Alphaproteobacteria (groupe d'Ă©tude) dans la branche des Gammaproteobacteria et dans la branche des Betaproteobacteria (groupe extĂ©rieur), on retrouve aussi des sĂ©quences des Gammaproteobacteria (groupe extĂ©rieur) dans les Alphaproteobacteria (groupe d'Ă©tude) ainsi que dans la branche des Betaproteobacteria mais cela est dĂ©jĂ  plus normale vu que ces deux sous-groupes du groupe extĂ©rieur sont phylogĂ©nĂ©tiquement proche. La sĂ©quence BPAMMM1 au milieu des Gammaproteobacteria semble juste mal placĂ© vu que le nĹ“ud F qu'il la relie Ă  des Gammaproteobacteria Ă  une robustesse mĂ©diocre de 0,03 de mĂŞme la sĂ©quence BPGC1 reliĂ© Ă  des Betaproteobacteria par le nĹ“ud E faiblement robuste 0,35 mais moins problĂ©matique car se dĂ©roule dans le groupe extĂ©rieur. Mais les autres sĂ©quences d'Alphaproteobacteria et de Gammaproteobacteria qui ne sont pas dans la branche avec le reste de leur phyla respectives, le sont reliĂ© Ă  des nĹ“uds plutĂ´t robuste. Cela ressemble donc au cas particulier d'une duplication de gènes. L'ORF se retrouve dans le groupe extĂ©rieur, plus particulièrement dans la branche des Gammaproteobacteria mais, reliĂ© au nĹ“ud G très peu robuste 0,28 il est reliĂ© via le nĹ“ud C Ă  deux sĂ©quence d'Alphaproteobacteria.
L'ORF 2 est donc ici encore à mi-chemin entre le groupe d'étude et le groupe extérieur, il semble bien provenir d'une Proteobacteria mais impossible de le placé comme il faut entre Alphaproteobacteria et Betaproteobacteria-Gammaproteobacteria.

 


Taxonomy Bacteria
Rank: superkingdom - Genetic Code: Bacterial and Plant Plastid - NCBI Identifier: 2
Kingdom: Bacteria - Phylum: - Class: - Order:
Bacteria;
Conclusion

La séquence est codante, via ORFinder (a et b) on y trouve 2 ORF un sur le brin sens plutôt cours et un sur le brin antisens ce dernier est le seul qui possède des homologues comme on peut le voir dans la Table 1. L'ORF 1 est un faux positif.
Un examen de la séquence plus spécifique avec ORFinder (c) indique les positions 400 à 1095, positions de départ qui sera confirmé par l'alignement multiple où l'on voit quasiment toutes les séquences bien démarrer à la même position par un Méthionine. L'ORF se terminant bien avant la fin de la séquence, il est donc complet en 5' et en 3'.
Comme on peut le voir dans la table 4 basé sur un blastp contre RefSeq_protein les séquences homologues les plus proches et avec une très faible E valeur (7E-102) sont des séquences dites "bacteriorhodopsin-like". Le blastp contre Swissprot renvoie une séquence qui est une bacteriorhodopsin-like mais annoté sous le nom "Blue-light absorbing proteorhodopsin". En me basant donc sur les fonctions de ces homologues et la définition des bacteriorhodopsin-like par NCBI je présuppose la fonction de la protéine codée par l'ORF2 comme étant une sorte de pompe à protons activé à la lumière. Qui peut avoir une fonction de récupération d’énergie, basée sur l’ouverture induite par la lumière de canaux protoniques, pour moduler la physiologie cellulaire en fonction de la variation d’intensité de la lumière, pourrait donc être une rhodopsine sensorielle, potentiellement associé à un composant transducteur. La protéine peut traverser les membranes.
Les terme GO associés serait donc : GO:0005886 ; GO:0010461 ; GO:0009881 ; GO:0007602 ; GO:1902600.
Comme le montre la table 5, avec une E valeur de 7,00E-102 obtenue avec des sĂ©quences homologue issue des  Alphaproteobacteria Candidatus Pelagibacterales on pourrait penser la sĂ©quence issu de ce groupe taxonomique, cependant Alphaproteobacteria Maricaulales avec 3,00E-96 possède un valeur de seulement 8 ordres de grandeurs au-dessus des Candidatus Pelagibacterales.
La table 5 nous indique  aussi que les meilleurs hits d'autre groupe taxonomique extĂ©rieur aux alphaprotĂ©obactĂ©ries sont : Gammaproteobacteria 2,00E-98 ; Betaproteobacteria 2,00E-97 ; Verrucomicrobia 1,00E-99 (qui n’est pas une ProtĂ©obactĂ©rie).
Dans la partit I, L'arbre 1 nous indique que la séquence semble se trouver à mi-chemin entre le groupe d'étude et le groupe extérieur et qu'il est donc difficile de la classer avec certitude d'un côté ou de l'autre. L'arbre 2 indique que l'ORF 2 appartient plus au groupé extérieur et serait issu des Maricaulales et le tout avec des nœuds très robustes (H à 0,82 et I à 0,78), cependant la robustesse des branches du groupe d'étude n'étant pas très haute (Noeud G à 0,53), il vaut mieux se méfier des conclusions issues de cet arbre. La séquence semble donc issue des Alphaproteobacteria.
Les analyse de la partie II pour déterminer si la séquence est bien issue d'une Protéobactérie, semble bien affirmer cette hypothèse, seulement une suspicion de transfert horizontale sur une séquence issues des Verrucomicrobia est soulevé par cet arbre. L'ORF et cette séquence reliée par un noud moyennement robuste (F à 0,46) lui-même relié à un nœud peu robuste (G à 0,27) nous indique que ces séquences ne sont pas très bien placées. L'appartenance supposé de la séquence aux Proteobacteria est donc peu robuste.

Les analyse de la partie III pour déterminer si la séquence est plutôt une Alpha ou une Beta/Gammaproteobacteria. L'arbre semble contenir des traces de duplications de gène. L'ORF2 se retrouve ici entre le groupe extérieur et le groupe d'étude même si relié à un nœud peu robuste (G à 0,28). Impossible de le placer entre ces taxa avec certitudes.
La séquence sembles donc être une Proteobacteria mais vu le risque de transfert horizontale avec Verrucomicrobia, position discutable. Il est difficile de la placer entre les Alpha ou les Beta/Gammaproteobacteria. Mais elle semble être très proche des Maricaulales au sein des Alphaproteobacteria.

 

Note pad