NCBI Conserved Domain Search

Conserved domains on [gi|1039736891|ref|XP_017169982|]

View

glutamine-rich protein 2 isoform X8 [Mus musculus]

Protein Classification

Graphical summary

Zoom to residue level

show extra options »

Show site features Horizontal zoom: ×

List of domain hits

Name

Accession

Description

Interval

E-value

DUF4795

pfam16043

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. ...

1843-2022

8.28e-80

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria and eukaryotes. Proteins in this family are typically between 285 and 978 amino acids in length.

Pssm-ID: 464990 [Multi-domain] Cd Length: 181 Bit Score: 261.08 E-value: 8.28e-80

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1843 QGQDEELLGHVQSAILQVQGDCEKLNITTSNLIEDHRQKQKDIEVLYQGIERLDKEKANREHLEMEIDEKADKSALASKV 1922
Cdd:pfam16043    2 KVEDAELLDQLQALILDLQEELEKLSETTSELSERLQQRQKHLEALYQQIEKLEKVKADKEVVEEELDEKADKEALASKV 81

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1923 SRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLELDPLKQMLEDRWKSLRQQLKERPPLYQADEA 2002
Cdd:pfam16043   82 SRDQFDETLEELNQMLQELLDKLEGQEDAWKKALETLSEELDTKLDRLELDPLKELLERRIKALQKLLQEGSEELDEAEA 161

                          170       180
                   ....*....|....*....|
gi 1039736891 2003 AAMRRQLLAHFHCLSCDRPL 2022
Cdd:pfam16043  162 AGFRKKLLERFHCISCDRPV 181

Glutenin_hmw super family

cl26620

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

592-1191

1.72e-16

High molecular weight glutenin subunit; Members of this family include high molecular weight subunits of glutenin. This group of gluten proteins is thought to be largely responsible for the elastic properties of gluten, and hence, doughs. Indeed, glutenin high molecular weight subunits are classified as elastomeric proteins, because the glutenin network can withstand significant deformations without breaking, and return to the original conformation when the stress is removed. Elastomeric proteins differ considerably in amino acid sequence, but they are all polymers whose subunits consist of elastomeric domains, composed of repeated motifs, and non-elastic domains that mediate cross-linking between the subunits. The elastomeric domain motifs are all rich in glycine residues in addition to other hydrophobic residues. High molecular weight glutenin subunits have an extensive central elastomeric domain, flanked by two terminal non-elastic domains that form disulphide cross-links. The central elastomeric domain is characterized by the following three repeated motifs: PGQGQQ, GYYPTS[P/L]QQ, GQQ. It possesses overlapping beta-turns within and between the repeated motifs, and assumes a regular helical secondary structure with a diameter of approx. 1.9 nm and a pitch of approx. 1.5 nm.

The actual alignment was detected with superfamily member pfam03157:

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 86.15 E-value: 1.72e-16

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  592 QQSLAQSRAGQQ-GLGQPSTVSGGLIQPGTDQhlvppgvdQPSLIQPGAFPLSLAQLGADQQgliqTDTGQPVWVQPSTD 670
Cdd:pfam03157  125 QASPQRPGQGQQpGQGQQWYYPTSPQQPGQWQ--------QPGQGQQGYYPTSPQQSGQRQQ----PGQGQQLRQGQQGQ 192

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  671 QSGGVQPGAY-----LPGWVQPSVDQRDLVQVGMDQQELRQPGAVQPGLVQPGAYAPGLMQVGASQDGLLQPGMDQLG-L 744
Cdd:pfam03157  193 QSGQGQPGYYptssqQPGQLQQTGQGQQGQQPERGQQGQQPGQGQQPGQGQQGQQPGQPQQLGQGQQGYYPISPQQPRqW 272

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  745 VQPGTAWSLVQPDVDQLDMAQPHGILPGLAQPRGVLPGMVQPGAVQPGvLQPGAVQPGvLQPGAVQPGVLQPGAAQPGLV 824
Cdd:pfam03157  273 QQSGQGQQGYYPTSLQQPGQGQSGYYPTSQQQAGQLQQEQQLGQEQQD-QQPGQGRQG-QQPGQGQQGQQPAQGQQPGQG 350

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  825 QPGAAQPGLVQPGAAQPGVLQAGAVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAAQPGMVHPGAAQPGMVQPGSVQPGMV 904
Cdd:pfam03157  351 QPGYYPTSPQQPGQGQPGYYPTSQQQPQQGQQPEQGQQGQQQGQGQQGQQPGQGQQPGQGQPGYYPTSPQQSGQGQPGYY 430

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  905 QLGAVQPGVLQAGAvqfGMVQPGAVEPGVLRAGAVQLGMVQPGAVQLGVfRAGAVQPGVLQAGAVQPGMVQQGPV--QPG 982
Cdd:pfam03157  431 PTSPQQSGQGQQPG---QGQQPGQEQPGQGQQPGQGQQGQQPGQPEQGQ-QPGQGQPGYYPTSPQQSGQGQQLGQwqQQG 506

                          410       420       430       440       450       460       470       480
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  983 VLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQSGAvQPGMVQPGILPS- 1061
Cdd:pfam03157  507 QGQPGYYPTSPLQPGQGQPGYYPTSPQQPGQGQQLGQLQQPTQGQQGQQSGQGQQGQQPGQGQQGQ-QPGQGQQGQQPGq 585

                          490       500       510       520       530       540       550       560
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1062 ----GWGQPVAYSLGLGQPGIGQY-------GLVQPRVDRYGFVQPGVARGLLQPSDSQRALMQPGVGQveWIQPGMSRR 1130
Cdd:pfam03157  586 gqqpGQGQPGYYPTSPQQSGQGQQpgqwqqpGQGQPGYYPTSSLQLGQGQQGYYPTSPQQPGQGQQPGQ--WQQSGQGQQ 663

                          570       580       590       600       610       620
                   ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 1039736891 1131 DLVQPGADESGLAQGGMAQQGLVQSGMARQGlaQPGMARQGVAHPGMARQ--GVAHPGKARQG 1191
Cdd:pfam03157  664 GYYPTSPQQSGQAQQPGQGQQPGQWLQPGQG--QQGYYPTSPQQPGQGQQlgQGQQSGQGQQG 724

PHA03378 super family

cl33729

EBNA-3B; Provisional

1215-1484

1.23e-09

EBNA-3B; Provisional

The actual alignment was detected with superfamily member PHA03378:

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 63.93 E-value: 1.23e-09

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1215 EDKFGLAQPIVDQsAFMQPGMDQ---RGLVQPRMYQYGFVDPSDLQRNFLQPrgvlprlvQPVVDQGGPLQaglaQSRMV 1291
Cdd:PHA03378   550 SDEPASTEPVHDQ-LLPAPGLGPlqiQPLTSPTTSQLASSAPSYAQTPWPVP--------HPSQTPEPPTT----QSHIP 616

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1292 QPITDQRGP--VQPETLQPRQVQPSTSRrglVQSLLTPYglmQPGAAQLGLVQPGMEQLGEERrglLQPGMDQPGLLQPG 1369
Cdd:PHA03378   617 ETSAPRQWPmpLRPIPMRPLRMQPITFN---VLVFPTPH---QPPQVEITPYKPTWTQIGHIP---YQPSPTGANTMLPI 687

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1370 TDQPGLLQPGADQPGLLQPGADQPGLLQPGADQPGFLQPGADQPGFLQPGAARLDRIQPGMVEPGAGPQGLGQPDLAPPP 1449
Cdd:PHA03378   688 QWAPGTMQPPPRAPTPMRPPAAPPGRAQRPAAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPP 767

                          250       260       270       280
                   ....*....|....*....|....*....|....*....|
gi 1039736891 1450 FIHPGIF-----PRGIFQPATLPRGfrQPTPTQPDFVTPS 1484
Cdd:PHA03378   768 AAAPGAPtpqppPQAPPAPQQRPRG--APTPQPPPQAGPT 805

YhaN super family

cl34808

Uncharacterized conserved protein YhaN, contains AAA domain [Function unknown];

1598-2010

3.35e-07

Uncharacterized conserved protein YhaN, contains AAA domain [Function unknown];

The actual alignment was detected with superfamily member COG4717:

Pssm-ID: 443752 [Multi-domain] Cd Length: 641 Bit Score: 55.54 E-value: 3.35e-07

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1598 ETRREQQRQESLppsfpmAVETLRLIGELISLYLELKEQLKDLDEELagqtdfEKIQYLItmivkktipQDLAEQLKSLK 1677
Cdd:COG4717    108 EAELEELREELE------KLEKLLQLLPLYQELEALEAELAELPERL------EELEERL---------EELRELEEELE 166

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1678 TLNKEVRQDKAKLEKIQKFVDSAADTTGGKGVKP-NHLSLQLGILRVTVSDIEKELNELRESQDRGKATMENSVSEASLY 1756
Cdd:COG4717    167 ELEAELAELQEELEELLEQLSLATEEELQDLAEElEELQQRLAELEEELEEAQEELEELEEELEQLENELEAAALEERLK 246

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1757 LQDQLDKLRTIIESMLGSSSTLLSMSITPHKSTA------CLVPGQIDPEATCPACSLDVSHQVSLLVQ-RYEQLQDMVS 1829
Cdd:COG4717    247 EARLLLLIAAALLALLGLGGSLLSLILTIAGVLFlvlgllALLFLLLAREKASLGKEAEELQALPALEElEEEELEELLA 326

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1830 GLAASRPSKKAKLQgQDEELLGHVQSAILQVQGDCEKLNIttsNLIEDHRQ------KQKDIEVLYQGIERLDKEKANRE 1903
Cdd:COG4717    327 ALGLPPDLSPEELL-ELLDRIEELQELLREAEELEEELQL---EELEQEIAallaeaGVEDEEELRAALEQAEEYQELKE 402

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1904 HLEmEIDEKADksALASKVSRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKlLAEMDSKLDRLELDPLKQMLEDRW 1983
Cdd:COG4717    403 ELE-ELEEQLE--ELLGELEELLEALDEEELEEELEELEEELEELEEELEELREE-LAELEAELEQLEEDGELAELLQEL 478

                          410       420
                   ....*....|....*....|....*....
gi 1039736891 1984 KSLRQQLKErpplyQADEAAAMR--RQLL 2010
Cdd:COG4717    479 EELKAELRE-----LAEEWAALKlaLELL 502

SMC_N super family

cl47134

RecF/RecN/SMC N terminal domain; This domain is found at the N terminus of SMC proteins. The ...

95-237

2.64e-04

RecF/RecN/SMC N terminal domain; This domain is found at the N terminus of SMC proteins. The SMC (structural maintenance of chromosomes) superfamily proteins have ATP-binding domains at the N- and C-termini, and two extended coiled-coil domains separated by a hinge in the middle. The eukaryotic SMC proteins form two kind of heterodimers: the SMC1/SMC3 and the SMC2/SMC4 types. These heterodimers constitute an essential part of higher order complexes, which are involved in chromatin and DNA dynamics. This family also includes the RecF and RecN proteins that are involved in DNA metabolism and recombination.

The actual alignment was detected with superfamily member TIGR02169:

Pssm-ID: 481474 [Multi-domain] Cd Length: 1164 Bit Score: 46.21 E-value: 2.64e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891   95 ELENQVKDLGNQVLDLTKQFKTMDNKVQGMATQIDQISVPELQQEEEIALVTQQVSLtkfskiYESEEMMEKPEPTVKMP 174
Cdd:TIGR02169  879 DLESRLGDLKKERDELEAQLRELERKIEELEAQIEKKRKRLSELKAKLEALEEELSE------IEDPKGEDEEIPEEELS 952

                           90       100       110       120       130       140
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*..
gi 1039736891  175 TEMVQLKpsrtpsLTKPTSVLQDLiEDVKiLKQASELQELLQRFNELE----KLVKSREEYLDLLSR 237
Cdd:TIGR02169  953 LEDVQAE------LQRVEEEIRAL-EPVN-MLAIQEYEEVLKRLDELKekraKLEEERKAILERIEE 1011

Name

Accession

Description

Interval

E-value

DUF4795

pfam16043

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. ...

1843-2022

8.28e-80

Pssm-ID: 464990 [Multi-domain] Cd Length: 181 Bit Score: 261.08 E-value: 8.28e-80

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1843 QGQDEELLGHVQSAILQVQGDCEKLNITTSNLIEDHRQKQKDIEVLYQGIERLDKEKANREHLEMEIDEKADKSALASKV 1922
Cdd:pfam16043    2 KVEDAELLDQLQALILDLQEELEKLSETTSELSERLQQRQKHLEALYQQIEKLEKVKADKEVVEEELDEKADKEALASKV 81

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1923 SRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLELDPLKQMLEDRWKSLRQQLKERPPLYQADEA 2002
Cdd:pfam16043   82 SRDQFDETLEELNQMLQELLDKLEGQEDAWKKALETLSEELDTKLDRLELDPLKELLERRIKALQKLLQEGSEELDEAEA 161

                          170       180
                   ....*....|....*....|
gi 1039736891 2003 AAMRRQLLAHFHCLSCDRPL 2022
Cdd:pfam16043  162 AGFRKKLLERFHCISCDRPV 181

Glutenin_hmw

pfam03157

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

592-1191

1.72e-16

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 86.15 E-value: 1.72e-16

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  592 QQSLAQSRAGQQ-GLGQPSTVSGGLIQPGTDQhlvppgvdQPSLIQPGAFPLSLAQLGADQQgliqTDTGQPVWVQPSTD 670
Cdd:pfam03157  125 QASPQRPGQGQQpGQGQQWYYPTSPQQPGQWQ--------QPGQGQQGYYPTSPQQSGQRQQ----PGQGQQLRQGQQGQ 192

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  671 QSGGVQPGAY-----LPGWVQPSVDQRDLVQVGMDQQELRQPGAVQPGLVQPGAYAPGLMQVGASQDGLLQPGMDQLG-L 744
Cdd:pfam03157  193 QSGQGQPGYYptssqQPGQLQQTGQGQQGQQPERGQQGQQPGQGQQPGQGQQGQQPGQPQQLGQGQQGYYPISPQQPRqW 272

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  745 VQPGTAWSLVQPDVDQLDMAQPHGILPGLAQPRGVLPGMVQPGAVQPGvLQPGAVQPGvLQPGAVQPGVLQPGAAQPGLV 824
Cdd:pfam03157  273 QQSGQGQQGYYPTSLQQPGQGQSGYYPTSQQQAGQLQQEQQLGQEQQD-QQPGQGRQG-QQPGQGQQGQQPAQGQQPGQG 350

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  825 QPGAAQPGLVQPGAAQPGVLQAGAVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAAQPGMVHPGAAQPGMVQPGSVQPGMV 904
Cdd:pfam03157  351 QPGYYPTSPQQPGQGQPGYYPTSQQQPQQGQQPEQGQQGQQQGQGQQGQQPGQGQQPGQGQPGYYPTSPQQSGQGQPGYY 430

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  905 QLGAVQPGVLQAGAvqfGMVQPGAVEPGVLRAGAVQLGMVQPGAVQLGVfRAGAVQPGVLQAGAVQPGMVQQGPV--QPG 982
Cdd:pfam03157  431 PTSPQQSGQGQQPG---QGQQPGQEQPGQGQQPGQGQQGQQPGQPEQGQ-QPGQGQPGYYPTSPQQSGQGQQLGQwqQQG 506

                          410       420       430       440       450       460       470       480
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  983 VLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQSGAvQPGMVQPGILPS- 1061
Cdd:pfam03157  507 QGQPGYYPTSPLQPGQGQPGYYPTSPQQPGQGQQLGQLQQPTQGQQGQQSGQGQQGQQPGQGQQGQ-QPGQGQQGQQPGq 585

                          490       500       510       520       530       540       550       560
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1062 ----GWGQPVAYSLGLGQPGIGQY-------GLVQPRVDRYGFVQPGVARGLLQPSDSQRALMQPGVGQveWIQPGMSRR 1130
Cdd:pfam03157  586 gqqpGQGQPGYYPTSPQQSGQGQQpgqwqqpGQGQPGYYPTSSLQLGQGQQGYYPTSPQQPGQGQQPGQ--WQQSGQGQQ 663

                          570       580       590       600       610       620
                   ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 1039736891 1131 DLVQPGADESGLAQGGMAQQGLVQSGMARQGlaQPGMARQGVAHPGMARQ--GVAHPGKARQG 1191
Cdd:pfam03157  664 GYYPTSPQQSGQAQQPGQGQQPGQWLQPGQG--QQGYYPTSPQQPGQGQQlgQGQQSGQGQQG 724

PHA03378

EBNA-3B; Provisional

617-980

3.12e-11

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 68.94 E-value: 3.12e-11

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  617 QPGTDQHLVPPGVDqPSLIQPGAFPLSlAQLGADQQGLIQTDTGQPvwvQPSTdQSGGVQPGAYLPGWVQPSVDQRDLvq 696
Cdd:PHA03378   557 EPVHDQLLPAPGLG-PLQIQPLTSPTT-SQLASSAPSYAQTPWPVP---HPSQ-TPEPPTTQSHIPETSAPRQWPMPL-- 628

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  697 vgmdqqelrQPGAVQPGLVQPGAYAPglmQVGASQDgllQPGMDQLGLVQPGTAWSLVQPdvdqldmAQPHGILPGLAQP 776
Cdd:PHA03378   629 ---------RPIPMRPLRMQPITFNV---LVFPTPH---QPPQVEITPYKPTWTQIGHIP-------YQPSPTGANTMLP 686

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  777 RGVLPGMVQPGAVQPGVLQPGAVQPGVLQPGAVQPGVLQPGAAQPGLVQPGAAQPGLVQPGAAQPGVLQAGAVQPGVLQA 856
Cdd:PHA03378   687 IQWAPGTMQPPPRAPTPMRPPAAPPGRAQRPAAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARP 766

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  857 GAVQPGmvQQGPVQPGVLQAGAAQPGMVHPGAAQPGMVQPGSVQ------PGMVQLGAVQPGVLQAGAVQFGmvQPGAVE 930
Cdd:PHA03378   767 PAAAPG--APTPQPPPQAPPAPQQRPRGAPTPQPPPQAGPTSMQlmpraaPGQQGPTKQILRQLLTGGVKRG--RPSLKK 842

                          330       340       350       360       370       380
                   ....*....|....*....|....*....|....*....|....*....|....*....|.
gi 1039736891  931 PGVLRAGAVQLGMVQPGA------VQLGVFRAGAVQPGVL--QAGAVQP---GMVQQGPVQ 980
Cdd:PHA03378   843 PAALERQAAAGPTPSPGSgtsdkiVQAPVFYPPVLQPIQVmrQLGSVRAaaaSTVTQAPTE 903

PHA03378

EBNA-3B; Provisional

1215-1484

1.23e-09

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 63.93 E-value: 1.23e-09

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1215 EDKFGLAQPIVDQsAFMQPGMDQ---RGLVQPRMYQYGFVDPSDLQRNFLQPrgvlprlvQPVVDQGGPLQaglaQSRMV 1291
Cdd:PHA03378   550 SDEPASTEPVHDQ-LLPAPGLGPlqiQPLTSPTTSQLASSAPSYAQTPWPVP--------HPSQTPEPPTT----QSHIP 616

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1292 QPITDQRGP--VQPETLQPRQVQPSTSRrglVQSLLTPYglmQPGAAQLGLVQPGMEQLGEERrglLQPGMDQPGLLQPG 1369
Cdd:PHA03378   617 ETSAPRQWPmpLRPIPMRPLRMQPITFN---VLVFPTPH---QPPQVEITPYKPTWTQIGHIP---YQPSPTGANTMLPI 687

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1370 TDQPGLLQPGADQPGLLQPGADQPGLLQPGADQPGFLQPGADQPGFLQPGAARLDRIQPGMVEPGAGPQGLGQPDLAPPP 1449
Cdd:PHA03378   688 QWAPGTMQPPPRAPTPMRPPAAPPGRAQRPAAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPP 767

                          250       260       270       280
                   ....*....|....*....|....*....|....*....|
gi 1039736891 1450 FIHPGIF-----PRGIFQPATLPRGfrQPTPTQPDFVTPS 1484
Cdd:PHA03378   768 AAAPGAPtpqppPQAPPAPQQRPRG--APTPQPPPQAGPT 805

Glutenin_hmw

pfam03157

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

975-1484

1.45e-08

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 60.35 E-value: 1.45e-08

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  975 QQGPVQPGvlQAGAVQPGMVQQ-GPVQPGVLQAGAVQPGMVQQ-GPVQPGVLQAGAVQPGMVQQGPV--QPGVLQSGAvQ 1050
Cdd:pfam03157  117 QQVSYYPG--QASPQRPGQGQQpGQGQQWYYPTSPQQPGQWQQpGQGQQGYYPTSPQQSGQRQQPGQgqQLRQGQQGQ-Q 193

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1051 PGMVQPGILPSGWGQPVAyslgLGQPGIGQYGLVQPRVDRYGFVQPGVARGLLQPSDSQRALMQPGVGQ-VEWIQPGMSR 1129
Cdd:pfam03157  194 SGQGQPGYYPTSSQQPGQ----LQQTGQGQQGQQPERGQQGQQPGQGQQPGQGQQGQQPGQPQQLGQGQqGYYPISPQQP 269

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1130 RDLVQPGADESGLAQGGMAQQGLVQSGMARQGLAQPGMARQgvAHPGMARQGVAHPGKARQGvAHPGKARQGVAQPDLAQ 1209
Cdd:pfam03157  270 RQWQQSGQGQQGYYPTSLQQPGQGQSGYYPTSQQQAGQLQQ--EQQLGQEQQDQQPGQGRQG-QQPGQGQQGQQPAQGQQ 346

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1210 PGAPSEDKFGLAQpivDQSAFMQPGMDQRGLVQPRMYQYGFVDPSDLQRNFLQPRGVLPRLVQPVVDQGGPLQAGLAQSR 1289
Cdd:pfam03157  347 PGQGQPGYYPTSP---QQPGQGQPGYYPTSQQQPQQGQQPEQGQQGQQQGQGQQGQQPGQGQQPGQGQPGYYPTSPQQSG 423

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1290 MVQPITDQRGPVQPETLQP--RQVQPSTSRRGLVQSLLTPYGLMQPGAAQLGLvQPGMEQLGEERRGLLQPGMDQP--GL 1365
Cdd:pfam03157  424 QGQPGYYPTSPQQSGQGQQpgQGQQPGQEQPGQGQQPGQGQQGQQPGQPEQGQ-QPGQGQPGYYPTSPQQSGQGQQlgQW 502

                          410       420       430       440       450       460       470       480
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1366 LQPGTDQPGLLQPGADQPGLLQPGADQPGLLQPGADQPGFLQPGADQPGFLQPGAARLDRIQPGMV----EPGAGPQGLG 1441
Cdd:pfam03157  503 QQQGQGQPGYYPTSPLQPGQGQPGYYPTSPQQPGQGQQLGQLQQPTQGQQGQQSGQGQQGQQPGQGqqgqQPGQGQQGQQ 582

                          490       500       510       520
                   ....*....|....*....|....*....|....*....|....*
gi 1039736891 1442 QPDLAPPPFIHPGIFPRGIFQP--ATLPRGFRQPTPTQPDFVTPS 1484
Cdd:pfam03157  583 PGQGQQPGQGQPGYYPTSPQQSgqGQQPGQWQQPGQGQPGYYPTS 627

YhaN

COG4717

Uncharacterized conserved protein YhaN, contains AAA domain [Function unknown];

1598-2010

3.35e-07

Uncharacterized conserved protein YhaN, contains AAA domain [Function unknown];

Pssm-ID: 443752 [Multi-domain] Cd Length: 641 Bit Score: 55.54 E-value: 3.35e-07

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1598 ETRREQQRQESLppsfpmAVETLRLIGELISLYLELKEQLKDLDEELagqtdfEKIQYLItmivkktipQDLAEQLKSLK 1677
Cdd:COG4717    108 EAELEELREELE------KLEKLLQLLPLYQELEALEAELAELPERL------EELEERL---------EELRELEEELE 166

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1678 TLNKEVRQDKAKLEKIQKFVDSAADTTGGKGVKP-NHLSLQLGILRVTVSDIEKELNELRESQDRGKATMENSVSEASLY 1756
Cdd:COG4717    167 ELEAELAELQEELEELLEQLSLATEEELQDLAEElEELQQRLAELEEELEEAQEELEELEEELEQLENELEAAALEERLK 246

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1757 LQDQLDKLRTIIESMLGSSSTLLSMSITPHKSTA------CLVPGQIDPEATCPACSLDVSHQVSLLVQ-RYEQLQDMVS 1829
Cdd:COG4717    247 EARLLLLIAAALLALLGLGGSLLSLILTIAGVLFlvlgllALLFLLLAREKASLGKEAEELQALPALEElEEEELEELLA 326

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1830 GLAASRPSKKAKLQgQDEELLGHVQSAILQVQGDCEKLNIttsNLIEDHRQ------KQKDIEVLYQGIERLDKEKANRE 1903
Cdd:COG4717    327 ALGLPPDLSPEELL-ELLDRIEELQELLREAEELEEELQL---EELEQEIAallaeaGVEDEEELRAALEQAEEYQELKE 402

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1904 HLEmEIDEKADksALASKVSRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKlLAEMDSKLDRLELDPLKQMLEDRW 1983
Cdd:COG4717    403 ELE-ELEEQLE--ELLGELEELLEALDEEELEEELEELEEELEELEEELEELREE-LAELEAELEQLEEDGELAELLQEL 478

                          410       420
                   ....*....|....*....|....*....
gi 1039736891 1984 KSLRQQLKErpplyQADEAAAMR--RQLL 2010
Cdd:COG4717    479 EELKAELRE-----LAEEWAALKlaLELL 502

PRK03918

DNA double-strand break repair ATPase Rad50;

1625-2010

8.74e-05

DNA double-strand break repair ATPase Rad50;

Pssm-ID: 235175 [Multi-domain] Cd Length: 880 Bit Score: 47.75 E-value: 8.74e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1625 ELISLYLELKEQLKDLDEELAGQTdfEKIQYLItmivkktipqdlaEQLKSLKTLNKEVRQDKAKLEKIQKFVDSaadtt 1704
Cdd:PRK03918   297 KLSEFYEEYLDELREIEKRLSRLE--EEINGIE-------------ERIKELEEKEERLEELKKKLKELEKRLEE----- 356

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1705 ggkgVKPNHLSLQlgilrvTVSDIEKELNELR-----ESQDRGKATMENsVSEASLYLQDQLDKLRTIIESMLGSSSTlL 1779
Cdd:PRK03918   357 ----LEERHELYE------EAKAKKEELERLKkrltgLTPEKLEKELEE-LEKAKEEIEEEISKITARIGELKKEIKE-L 424

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1780 SMSITPHKSTaclvpgqidpEATCPACS--LDVSHQVSLLVQRYEQLQDMVSGLA--ASRPSK----KAKLQG---QDEE 1848
Cdd:PRK03918   425 KKAIEELKKA----------KGKCPVCGreLTEEHRKELLEEYTAELKRIEKELKeiEEKERKlrkeLRELEKvlkKESE 494

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1849 LLGHVQSA--ILQVQGDCEKLNITT--------SNLIEDHRQKQKDIEVLYQGIERLDKEKANREHLEMEIDE-KADKSA 1917
Cdd:PRK03918   495 LIKLKELAeqLKELEEKLKKYNLEElekkaeeyEKLKEKLIKLKGEIKSLKKELEKLEELKKKLAELEKKLDElEEELAE 574

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1918 LASKVSRIQFDaTTEQLNHMMQEL--------VAKMSGQE-QDWQKLLDKLLAEMDSKLDRLELdplkqmLEDRWKSLRQ 1988
Cdd:PRK03918   575 LLKELEELGFE-SVEELEERLKELepfyneylELKDAEKElEREEKELKKLEEELDKAFEELAE------TEKRLEELRK 647

                          410       420
                   ....*....|....*....|..
gi 1039736891 1989 QLKERPPLYQADEAAAMRRQLL 2010
Cdd:PRK03918   648 ELEELEKKYSEEEYEELREEYL 669

SMC_prok_A

TIGR02169

chromosome segregation protein SMC, primarily archaeal type; SMC (structural maintenance of ...

95-237

2.64e-04

chromosome segregation protein SMC, primarily archaeal type; SMC (structural maintenance of chromosomes) proteins bind DNA and act in organizing and segregating chromosomes for partition. SMC proteins are found in bacteria, archaea, and eukaryotes. It is found in a single copy and is homodimeric in prokaryotes, but six paralogs (excluded from this family) are found in eukarotes, where SMC proteins are heterodimeric. This family represents the SMC protein of archaea and a few bacteria (Aquifex, Synechocystis, etc); the SMC of other bacteria is described by TIGR02168. The N- and C-terminal domains of this protein are well conserved, but the central hinge region is skewed in composition and highly divergent. [Cellular processes, Cell division, DNA metabolism, Chromosome-associated proteins]

Pssm-ID: 274009 [Multi-domain] Cd Length: 1164 Bit Score: 46.21 E-value: 2.64e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891   95 ELENQVKDLGNQVLDLTKQFKTMDNKVQGMATQIDQISVPELQQEEEIALVTQQVSLtkfskiYESEEMMEKPEPTVKMP 174
Cdd:TIGR02169  879 DLESRLGDLKKERDELEAQLRELERKIEELEAQIEKKRKRLSELKAKLEALEEELSE------IEDPKGEDEEIPEEELS 952

                           90       100       110       120       130       140
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*..
gi 1039736891  175 TEMVQLKpsrtpsLTKPTSVLQDLiEDVKiLKQASELQELLQRFNELE----KLVKSREEYLDLLSR 237
Cdd:TIGR02169  953 LEDVQAE------LQRVEEEIRAL-EPVN-MLAIQEYEEVLKRLDELKekraKLEEERKAILERIEE 1011

Cast

pfam10174

RIM-binding protein of the cytomatrix active zone; This is a family of proteins that form part ...

1633-1980

3.93e-04

RIM-binding protein of the cytomatrix active zone; This is a family of proteins that form part of the CAZ (cytomatrix at the active zone) complex which is involved in determining the site of synaptic vesicle fusion. The C-terminus is a PDZ-binding motif that binds directly to RIM (a small G protein Rab-3A effector). The family also contains four coiled-coil domains.

Pssm-ID: 431111 [Multi-domain] Cd Length: 766 Bit Score: 45.58 E-value: 3.93e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1633 LKEQLKDLDEELAG--------QTDFEKIQYLITmivkkTIPQDLAEQLKSLKTLNKEV-RQDKAKLEKIQkfvdsaadt 1703
Cdd:pfam10174  406 LQEQLRDKDKQLAGlkervkslQTDSSNTDTALT-----TLEEALSEKERIIERLKEQReREDRERLEELE--------- 471

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1704 tggkgvkpnhlslqlgilrvtvsDIEKELNELRESQDrgkaTMENSVSEASLYLQDQLDKLRTIIESMLGSSSTLLSMSI 1783
Cdd:pfam10174  472 -----------------------SLKKENKDLKEKVS----ALQPELTEKESSLIDLKEHASSLASSGLKKDSKLKSLEI 524

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1784 TPHKSTAclvpgqidpEATCPACSLDVSHQVSLLVQRYEQLQDMVSGLAASRPSKK---AKLQGQDEELLGhvqsaILQv 1860
Cdd:pfam10174  525 AVEQKKE---------ECSKLENQLKKAHNAEEAVRTNPEINDRIRLLEQEVARYKeesGKAQAEVERLLG-----ILR- 589

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1861 QGDCEKLNittsnliedhrqKQKDIEVLYQGIERLDKEK----ANREHLEMEidEKADKSALASKVSRIQFDATTEQLNH 1936
Cdd:pfam10174  590 EVENEKND------------KDKKIAELESLTLRQMKEQnkkvANIKHGQQE--MKKKGAQLLEEARRREDNLADNSQQL 655

                          330       340       350       360       370
                   ....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1937 MMQELVAKMSG--QEQDWQKL----LDKLLAEMDSKLDRLELDPLKQMLE 1980
Cdd:pfam10174  656 QLEELMGALEKtrQELDATKArlssTQQSLAEKDGHLTNLRAERRKQLEE 705

COG4913

Uncharacterized conserved protein, contains a C-terminal ATPase domain [Function unknown];

1811-1977

6.47e-03

Uncharacterized conserved protein, contains a C-terminal ATPase domain [Function unknown];

Pssm-ID: 443941 [Multi-domain] Cd Length: 1089 Bit Score: 41.82 E-value: 6.47e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1811 SHQVSLLVQRYEQLQDMVSGLAASRPSKKAKLQGQDEELLGhVQSAILQVQGDceklnittsnliedhrqkqkDIEVLYQ 1890
Cdd:COG4913    287 QRRLELLEAELEELRAELARLEAELERLEARLDALREELDE-LEAQIRGNGGD--------------------RLEQLER 345

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1891 GIERLDKEKANREHLEMEIDEKADKSALASKVSRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKlLAEMDSKLDRL 1970
Cdd:COG4913    346 EIERLERELEERERRRARLEALLAALGLPLPASAEEFAALRAEAAALLEALEEELEALEEALAEAEAA-LRDLRRELREL 424


                   ....*....
gi 1039736891 1971 --ELDPLKQ 1977
Cdd:COG4913    425 eaEIASLER 433

ClyA_XaxA-like

cd22657

Xenorhabdus nematophila alpha-xenorhabdolysin (XaxA) and Yersinia enterocolitica YaxA, and ...

1617-1780

7.96e-03

Xenorhabdus nematophila alpha-xenorhabdolysin (XaxA) and Yersinia enterocolitica YaxA, and similar proteins; This model includes Xenorhabdus nematophila alpha-xenorhabdolysin (XaxA) and Yersinia enterocolitica YaxA, both parts of two-component alpha-helical pore-forming toxins (alpha-PFTs). The xaxAB genes encoding the XaxAB toxin have also been also identified in various plant and human pathogens. XaxAB triggers necrosis and apoptosis in both insect hemocytes and mammalian cells. Structure studies show that component A binds to component B's back, forming a subunit; twelve to fifteen of these subunits then conjoin as the pore-forming toxin. Component A stabilizes each subunit on the membrane and activates component B, which then punctures the membrane by swinging out its lower end. Similarly, Yersinia enterocolitica YaxA, encoded by the yaxAB gene, forms a pore predominantly composed of decamers of YaxA-YaxB heterodimers. Although both subunits bear membrane-active moieties, only YaxA is capable of binding to membranes by itself and YaxB is subsequently recruited to membrane-associated YaxA and induced to present its lytic transmembrane helices; pore formation then progresses by further oligomerization of YaxA-YaxB dimers. YaxAB has been found to be strongly upregulated by the Yersinia master regulator RovA, a transcriptional activator of Yersinia outer membrane protein invasion which is involved in bacterial attachment and invasion across the intestinal epithelium.

Pssm-ID: 439155 [Multi-domain] Cd Length: 306 Bit Score: 40.65 E-value: 7.96e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1617 VETLRLIGELISLYL----ELKEQLKDLDEELAGQTDFEkIQYLITMIVKKTIPQDLAEQLKSLKTLNKEVRQdkaKLEK 1692
Cdd:cd22657     94 GEYLEDIKEDIKEYSksteEVKARLDDFRDELREELIPE-VKLKLKLIDRNDLDEEIEELNEEIDELDEEIDE---LNKE 169

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1693 IQKFVDSAAdtTGGKGVkPNHLSLQLGILRVTVSDIEKELNELRESQDR------GKATMENSVSEASLYLQD------- 1759
Cdd:cd22657    170 YKKLVGLAF--TGLAGG-PIGLLITGGIFGVKAEKIRKERNELIAEREEliqklkSKNRLLGSLERLETDLQDldirmid 246

                          170       180
                   ....*....|....*....|....*..
gi 1039736891 1760 ------QLDKLRTIIESMLGSSSTLLS 1780
Cdd:cd22657    247 aevatkNLETVWNTILTYIDASAEELD 273

Name

Accession

Description

Interval

E-value

DUF4795

pfam16043

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. ...

1843-2022

8.28e-80

Pssm-ID: 464990 [Multi-domain] Cd Length: 181 Bit Score: 261.08 E-value: 8.28e-80

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1843 QGQDEELLGHVQSAILQVQGDCEKLNITTSNLIEDHRQKQKDIEVLYQGIERLDKEKANREHLEMEIDEKADKSALASKV 1922
Cdd:pfam16043    2 KVEDAELLDQLQALILDLQEELEKLSETTSELSERLQQRQKHLEALYQQIEKLEKVKADKEVVEEELDEKADKEALASKV 81

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1923 SRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLELDPLKQMLEDRWKSLRQQLKERPPLYQADEA 2002
Cdd:pfam16043   82 SRDQFDETLEELNQMLQELLDKLEGQEDAWKKALETLSEELDTKLDRLELDPLKELLERRIKALQKLLQEGSEELDEAEA 161

                          170       180
                   ....*....|....*....|
gi 1039736891 2003 AAMRRQLLAHFHCLSCDRPL 2022
Cdd:pfam16043  162 AGFRKKLLERFHCISCDRPV 181

Glutenin_hmw

pfam03157

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

592-1191

1.72e-16

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 86.15 E-value: 1.72e-16

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  592 QQSLAQSRAGQQ-GLGQPSTVSGGLIQPGTDQhlvppgvdQPSLIQPGAFPLSLAQLGADQQgliqTDTGQPVWVQPSTD 670
Cdd:pfam03157  125 QASPQRPGQGQQpGQGQQWYYPTSPQQPGQWQ--------QPGQGQQGYYPTSPQQSGQRQQ----PGQGQQLRQGQQGQ 192

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  671 QSGGVQPGAY-----LPGWVQPSVDQRDLVQVGMDQQELRQPGAVQPGLVQPGAYAPGLMQVGASQDGLLQPGMDQLG-L 744
Cdd:pfam03157  193 QSGQGQPGYYptssqQPGQLQQTGQGQQGQQPERGQQGQQPGQGQQPGQGQQGQQPGQPQQLGQGQQGYYPISPQQPRqW 272

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  745 VQPGTAWSLVQPDVDQLDMAQPHGILPGLAQPRGVLPGMVQPGAVQPGvLQPGAVQPGvLQPGAVQPGVLQPGAAQPGLV 824
Cdd:pfam03157  273 QQSGQGQQGYYPTSLQQPGQGQSGYYPTSQQQAGQLQQEQQLGQEQQD-QQPGQGRQG-QQPGQGQQGQQPAQGQQPGQG 350

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  825 QPGAAQPGLVQPGAAQPGVLQAGAVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAAQPGMVHPGAAQPGMVQPGSVQPGMV 904
Cdd:pfam03157  351 QPGYYPTSPQQPGQGQPGYYPTSQQQPQQGQQPEQGQQGQQQGQGQQGQQPGQGQQPGQGQPGYYPTSPQQSGQGQPGYY 430

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  905 QLGAVQPGVLQAGAvqfGMVQPGAVEPGVLRAGAVQLGMVQPGAVQLGVfRAGAVQPGVLQAGAVQPGMVQQGPV--QPG 982
Cdd:pfam03157  431 PTSPQQSGQGQQPG---QGQQPGQEQPGQGQQPGQGQQGQQPGQPEQGQ-QPGQGQPGYYPTSPQQSGQGQQLGQwqQQG 506

                          410       420       430       440       450       460       470       480
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  983 VLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQSGAvQPGMVQPGILPS- 1061
Cdd:pfam03157  507 QGQPGYYPTSPLQPGQGQPGYYPTSPQQPGQGQQLGQLQQPTQGQQGQQSGQGQQGQQPGQGQQGQ-QPGQGQQGQQPGq 585

                          490       500       510       520       530       540       550       560
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1062 ----GWGQPVAYSLGLGQPGIGQY-------GLVQPRVDRYGFVQPGVARGLLQPSDSQRALMQPGVGQveWIQPGMSRR 1130
Cdd:pfam03157  586 gqqpGQGQPGYYPTSPQQSGQGQQpgqwqqpGQGQPGYYPTSSLQLGQGQQGYYPTSPQQPGQGQQPGQ--WQQSGQGQQ 663

                          570       580       590       600       610       620
                   ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 1039736891 1131 DLVQPGADESGLAQGGMAQQGLVQSGMARQGlaQPGMARQGVAHPGMARQ--GVAHPGKARQG 1191
Cdd:pfam03157  664 GYYPTSPQQSGQAQQPGQGQQPGQWLQPGQG--QQGYYPTSPQQPGQGQQlgQGQQSGQGQQG 724

Glutenin_hmw

pfam03157

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

701-1418

1.25e-13

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 76.91 E-value: 1.25e-13

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  701 QQELRQPG-AVQPGLVQPGAYAPGLMQVGASQD-GLLQPGMDQLGLVQPGtawSLVQPDVDQLDMAQPHGILPGLAQPRG 778
Cdd:pfam03157  125 QASPQRPGqGQQPGQGQQWYYPTSPQQPGQWQQpGQGQQGYYPTSPQQSG---QRQQPGQGQQLRQGQQGQQSGQGQPGY 201

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  779 VLPGMVQPGAVQPGVLQPGAVQPGVLQPGAVQPGVLQPGAAQPGLvQPGAAQpglvQPGAAQPGVLQAGAVQPGVLQ-AG 857
Cdd:pfam03157  202 YPTSSQQPGQLQQTGQGQQGQQPERGQQGQQPGQGQQPGQGQQGQ-QPGQPQ----QLGQGQQGYYPISPQQPRQWQqSG 276

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  858 AVQPGMVQQGPVQPGVLQAG--AAQPGMVHPGAAQPGMVQPGSVQPGMVQLGAVQPGVLQAGAVQFGMVQPGAVEPGVLR 935
Cdd:pfam03157  277 QGQQGYYPTSLQQPGQGQSGyyPTSQQQAGQLQQEQQLGQEQQDQQPGQGRQGQQPGQGQQGQQPAQGQQPGQGQPGYYP 356

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  936 AGAVQLGMVQPGAvqlgvFRAGAVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQ 1015
Cdd:pfam03157  357 TSPQQPGQGQPGY-----YPTSQQQPQQGQQPEQGQQGQQQGQGQQGQQPGQGQQPGQGQPGYYPTSPQQSGQGQPGYYP 431

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1016 QGPVQPGVLQAGAVQPGMVQQGPVQ---PGVLQSGAvQPGMVQPGILPsGWGQPVAYSLGLGQPGIGQyglvqprvDRYG 1092
Cdd:pfam03157  432 TSPQQSGQGQQPGQGQQPGQEQPGQgqqPGQGQQGQ-QPGQPEQGQQP-GQGQPGYYPTSPQQSGQGQ--------QLGQ 501

                          410       420       430       440       450       460       470       480
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1093 FVQPGVArgllQPSDSQRALMQPGVGQvewiqPGMSRRDLVQPGADESGLAQGGMAQQGLVQSGMARQGLAQPGMARQGv 1172
Cdd:pfam03157  502 WQQQGQG----QPGYYPTSPLQPGQGQ-----PGYYPTSPQQPGQGQQLGQLQQPTQGQQGQQSGQGQQGQQPGQGQQG- 571

                          490       500       510       520       530       540       550       560
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1173 AHPGMARQGvAHPGKARQgvahPGKARQGVAQPDLAQPGApsedkfGLAQPIVDQSAFMQPGMDQRGLVQPRMYQYGFVD 1252
Cdd:pfam03157  572 QQPGQGQQG-QQPGQGQQ----PGQGQPGYYPTSPQQSGQ------GQQPGQWQQPGQGQPGYYPTSSLQLGQGQQGYYP 640

                          570       580       590       600       610       620       630       640
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1253 PSdlqrnflqprgvlprlvqpvvdqggPLQAGLAQsrmvqpitdqrgpvqpetlQPRQVQPStsrrGLVQSLLTPYGLMQ 1332
Cdd:pfam03157  641 TS-------------------------PQQPGQGQ-------------------QPGQWQQS----GQGQQGYYPTSPQQ 672

                          650       660       670       680       690       700       710       720
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1333 PGAAQlglvQPGMeqlGEERRGLLQPGMDQPGLLQPGTDQPGllqPGADQPGLLQPGADQPGLLQPGADQPGflQPGADQ 1412
Cdd:pfam03157  673 SGQAQ----QPGQ---GQQPGQWLQPGQGQQGYYPTSPQQPG---QGQQLGQGQQSGQGQQGYYPTSPGQGQ--QSGQGQ 740


                   ....*.
gi 1039736891 1413 PGFLQP 1418
Cdd:pfam03157  741 QGYDSP 746

Glutenin_hmw

pfam03157

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

439-1056

5.61e-13

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 74.60 E-value: 5.61e-13

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  439 PGMDREGTEQAAVRDSGQGPWP-TAQQGLIAVGVDQHG-LPIPGTGQQGLPPQHMDQRGLVTPGTdqraFSPSLSDERTL 516
Cdd:pfam03157  137 PGQGQQWYYPTSPQQPGQWQQPgQGQQGYYPTSPQQSGqRQQPGQGQQLRQGQQGQQSGQGQPGY----YPTSSQQPGQL 212

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  517 VSLGLMQVSTDQQGFRQSSLTSRFIQPGAEQLRVEQRGVAQPGLDRRSSVPVGTERRASLQALAE-KRSSVPIEVEQQSL 595
Cdd:pfam03157  213 QQTGQGQQGQQPERGQQGQQPGQGQQPGQGQQGQQPGQPQQLGQGQQGYYPISPQQPRQWQQSGQgQQGYYPTSLQQPGQ 292

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  596 AQS-----------------RAGQQGLGQPSTVSGGLIQPGTDQHLVPPGV-DQPSLIQPGAFPLSLAQLGADQQGLIQT 657
Cdd:pfam03157  293 GQSgyyptsqqqagqlqqeqQLGQEQQDQQPGQGRQGQQPGQGQQGQQPAQgQQPGQGQPGYYPTSPQQPGQGQPGYYPT 372

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  658 DTGQPVWVQPSTDQSGGVQPGAYLPGWVQPSVDQRDLVQVGMDQQELRQPGAVQPG--LVQPGAYAPGLMQVGASQDGLL 735
Cdd:pfam03157  373 SQQQPQQGQQPEQGQQGQQQGQGQQGQQPGQGQQPGQGQPGYYPTSPQQSGQGQPGyyPTSPQQSGQGQQPGQGQQPGQE 452

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  736 QPGMDQlglvQPGTAWSLVQPDVDQldmaqpHGILPGLAQPRGVLPGMVQPG-AVQPGVLQpgavQPGVLQPGAVQPGVL 814
Cdd:pfam03157  453 QPGQGQ----QPGQGQQGQQPGQPE------QGQQPGQGQPGYYPTSPQQSGqGQQLGQWQ----QQGQGQPGYYPTSPL 518

                          410       420       430       440       450       460       470       480
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  815 QPGAAQPGLVQPGAAQPGLVQPGAAQPGVLQAGAVQPGVLQAGAVQPGMVQQGPvQPGVLQAGAAQPGMVHPGAAQPGMV 894
Cdd:pfam03157  519 QPGQGQPGYYPTSPQQPGQGQQLGQLQQPTQGQQGQQSGQGQQGQQPGQGQQGQ-QPGQGQQGQQPGQGQQPGQGQPGYY 597

                          490       500       510       520       530       540       550       560
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  895 QPGSVQPGMVQlgavQPGVLQagavqfgmvQPGAVEPGVLRAGAVQLGMVQPGAVQLGVFRAG-AVQPGVLQagavQPGM 973
Cdd:pfam03157  598 PTSPQQSGQGQ----QPGQWQ---------QPGQGQPGYYPTSSLQLGQGQQGYYPTSPQQPGqGQQPGQWQ----QSGQ 660

                          570       580       590       600       610       620       630       640
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  974 VQQGPVQPGVLQAGAVQPGMVQQGPVQpgVLQAGAVQPGMVQQGPVQPGVLQ--AGAVQPGMVQQG--PVQPGV-LQSGA 1048
Cdd:pfam03157  661 GQQGYYPTSPQQSGQAQQPGQGQQPGQ--WLQPGQGQQGYYPTSPQQPGQGQqlGQGQQSGQGQQGyyPTSPGQgQQSGQ 738


                   ....*...
gi 1039736891 1049 VQPGMVQP 1056
Cdd:pfam03157  739 GQQGYDSP 746

PHA03378

EBNA-3B; Provisional

617-980

3.12e-11

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 68.94 E-value: 3.12e-11

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  617 QPGTDQHLVPPGVDqPSLIQPGAFPLSlAQLGADQQGLIQTDTGQPvwvQPSTdQSGGVQPGAYLPGWVQPSVDQRDLvq 696
Cdd:PHA03378   557 EPVHDQLLPAPGLG-PLQIQPLTSPTT-SQLASSAPSYAQTPWPVP---HPSQ-TPEPPTTQSHIPETSAPRQWPMPL-- 628

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  697 vgmdqqelrQPGAVQPGLVQPGAYAPglmQVGASQDgllQPGMDQLGLVQPGTAWSLVQPdvdqldmAQPHGILPGLAQP 776
Cdd:PHA03378   629 ---------RPIPMRPLRMQPITFNV---LVFPTPH---QPPQVEITPYKPTWTQIGHIP-------YQPSPTGANTMLP 686

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  777 RGVLPGMVQPGAVQPGVLQPGAVQPGVLQPGAVQPGVLQPGAAQPGLVQPGAAQPGLVQPGAAQPGVLQAGAVQPGVLQA 856
Cdd:PHA03378   687 IQWAPGTMQPPPRAPTPMRPPAAPPGRAQRPAAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARP 766

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  857 GAVQPGmvQQGPVQPGVLQAGAAQPGMVHPGAAQPGMVQPGSVQ------PGMVQLGAVQPGVLQAGAVQFGmvQPGAVE 930
Cdd:PHA03378   767 PAAAPG--APTPQPPPQAPPAPQQRPRGAPTPQPPPQAGPTSMQlmpraaPGQQGPTKQILRQLLTGGVKRG--RPSLKK 842

                          330       340       350       360       370       380
                   ....*....|....*....|....*....|....*....|....*....|....*....|.
gi 1039736891  931 PGVLRAGAVQLGMVQPGA------VQLGVFRAGAVQPGVL--QAGAVQP---GMVQQGPVQ 980
Cdd:PHA03378   843 PAALERQAAAGPTPSPGSgtsdkiVQAPVFYPPVLQPIQVmrQLGSVRAaaaSTVTQAPTE 903

PHA03378

EBNA-3B; Provisional

1215-1484

1.23e-09

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 63.93 E-value: 1.23e-09

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1215 EDKFGLAQPIVDQsAFMQPGMDQ---RGLVQPRMYQYGFVDPSDLQRNFLQPrgvlprlvQPVVDQGGPLQaglaQSRMV 1291
Cdd:PHA03378   550 SDEPASTEPVHDQ-LLPAPGLGPlqiQPLTSPTTSQLASSAPSYAQTPWPVP--------HPSQTPEPPTT----QSHIP 616

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1292 QPITDQRGP--VQPETLQPRQVQPSTSRrglVQSLLTPYglmQPGAAQLGLVQPGMEQLGEERrglLQPGMDQPGLLQPG 1369
Cdd:PHA03378   617 ETSAPRQWPmpLRPIPMRPLRMQPITFN---VLVFPTPH---QPPQVEITPYKPTWTQIGHIP---YQPSPTGANTMLPI 687

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1370 TDQPGLLQPGADQPGLLQPGADQPGLLQPGADQPGFLQPGADQPGFLQPGAARLDRIQPGMVEPGAGPQGLGQPDLAPPP 1449
Cdd:PHA03378   688 QWAPGTMQPPPRAPTPMRPPAAPPGRAQRPAAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPP 767

                          250       260       270       280
                   ....*....|....*....|....*....|....*....|
gi 1039736891 1450 FIHPGIF-----PRGIFQPATLPRGfrQPTPTQPDFVTPS 1484
Cdd:PHA03378   768 AAAPGAPtpqppPQAPPAPQQRPRG--APTPQPPPQAGPT 805

Med15

pfam09606

ARC105 or Med15 subunit of Mediator complex non-fungal; The approx. 70 residue Med15 domain of ...

733-1056

1.73e-09

ARC105 or Med15 subunit of Mediator complex non-fungal; The approx. 70 residue Med15 domain of the ARC-Mediator co-activator is a three-helix bundle with marked similarity to the KIX domain. The sterol regulatory element binding protein (SREBP) family of transcription activators use the ARC105 subunit to activate target genes in the regulation of cholesterol and fatty acid homeostasis. In addition, Med15 is a critical transducer of gene activation signals that control early metazoan development.

Pssm-ID: 312941 [Multi-domain] Cd Length: 732 Bit Score: 63.10 E-value: 1.73e-09

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  733 GLLQPGMDQLGLVQPGTAWSLVQPDVDQLDMAQPHGILPGLAQPRGVLPGMVQPGAVQPGVLQPGA-VQPGvlQPGAVQP 811
Cdd:pfam09606  138 GFPSQMSRVGRMQPGGQAGGMMQPSSGQPGSGTPNQMGPNGGPGQGQAGGMNGGQQGPMGGQMPPQmGVPG--MPGPADA 215

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  812 GVlQPGAAQPGLVQPGAAQPGLVQPGAAQPGVLQAGAVQPGVLQAGAVQPGMVQQGpVQPGVLQAGAAQPGMVHPGaaqp 891
Cdd:pfam09606  216 GA-QMGQQAQANGGMNPQQMGGAPNQVAMQQQQPQQQGQQSQLGMGINQMQQMPQG-VGGGAGQGGPGQPMGPPGQ---- 289

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  892 gmvQPGSVQPGMvqlGAVQPGVLQAGAVQFGMVQPGAVEPGvlragAVQLGMVQPG--AVQLGVFRAGAVQPGVLQAGAV 969
Cdd:pfam09606  290 ---QPGAMPNVM---SIGDQNNYQQQQTRQQQQQQGGNHPA-----AHQQQMNQSVgqGGQVVALGGLNHLETWNPGNFG 358

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  970 QPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPgvlqagavQPGMVQQGPVQPGVLQAGAVQPGMVQQGPV-QPGVLQSGA 1048
Cdd:pfam09606  359 GLGANPMQRGQPGMMSSPSPVPGQQVRQVTPN--------QFMRQSPQPSVPSPQGPGSQPPQSHPGGMIpSPALIPSPS 430


                   ....*...
gi 1039736891 1049 VQPGMVQP 1056
Cdd:pfam09606  431 PQMSQQPA 438

Glutenin_hmw

pfam03157

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

975-1484

1.45e-08

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 60.35 E-value: 1.45e-08

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  975 QQGPVQPGvlQAGAVQPGMVQQ-GPVQPGVLQAGAVQPGMVQQ-GPVQPGVLQAGAVQPGMVQQGPV--QPGVLQSGAvQ 1050
Cdd:pfam03157  117 QQVSYYPG--QASPQRPGQGQQpGQGQQWYYPTSPQQPGQWQQpGQGQQGYYPTSPQQSGQRQQPGQgqQLRQGQQGQ-Q 193

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1051 PGMVQPGILPSGWGQPVAyslgLGQPGIGQYGLVQPRVDRYGFVQPGVARGLLQPSDSQRALMQPGVGQ-VEWIQPGMSR 1129
Cdd:pfam03157  194 SGQGQPGYYPTSSQQPGQ----LQQTGQGQQGQQPERGQQGQQPGQGQQPGQGQQGQQPGQPQQLGQGQqGYYPISPQQP 269

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1130 RDLVQPGADESGLAQGGMAQQGLVQSGMARQGLAQPGMARQgvAHPGMARQGVAHPGKARQGvAHPGKARQGVAQPDLAQ 1209
Cdd:pfam03157  270 RQWQQSGQGQQGYYPTSLQQPGQGQSGYYPTSQQQAGQLQQ--EQQLGQEQQDQQPGQGRQG-QQPGQGQQGQQPAQGQQ 346

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1210 PGAPSEDKFGLAQpivDQSAFMQPGMDQRGLVQPRMYQYGFVDPSDLQRNFLQPRGVLPRLVQPVVDQGGPLQAGLAQSR 1289
Cdd:pfam03157  347 PGQGQPGYYPTSP---QQPGQGQPGYYPTSQQQPQQGQQPEQGQQGQQQGQGQQGQQPGQGQQPGQGQPGYYPTSPQQSG 423

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1290 MVQPITDQRGPVQPETLQP--RQVQPSTSRRGLVQSLLTPYGLMQPGAAQLGLvQPGMEQLGEERRGLLQPGMDQP--GL 1365
Cdd:pfam03157  424 QGQPGYYPTSPQQSGQGQQpgQGQQPGQEQPGQGQQPGQGQQGQQPGQPEQGQ-QPGQGQPGYYPTSPQQSGQGQQlgQW 502

                          410       420       430       440       450       460       470       480
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1366 LQPGTDQPGLLQPGADQPGLLQPGADQPGLLQPGADQPGFLQPGADQPGFLQPGAARLDRIQPGMV----EPGAGPQGLG 1441
Cdd:pfam03157  503 QQQGQGQPGYYPTSPLQPGQGQPGYYPTSPQQPGQGQQLGQLQQPTQGQQGQQSGQGQQGQQPGQGqqgqQPGQGQQGQQ 582

                          490       500       510       520
                   ....*....|....*....|....*....|....*....|....*
gi 1039736891 1442 QPDLAPPPFIHPGIFPRGIFQP--ATLPRGFRQPTPTQPDFVTPS 1484
Cdd:pfam03157  583 PGQGQQPGQGQPGYYPTSPQQSgqGQQPGQWQQPGQGQPGYYPTS 627

Med15

pfam09606

ARC105 or Med15 subunit of Mediator complex non-fungal; The approx. 70 residue Med15 domain of ...

1020-1478

2.21e-07

Pssm-ID: 312941 [Multi-domain] Cd Length: 732 Bit Score: 56.17 E-value: 2.21e-07

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1020 QPGVLQAGAVQPGMVQQGPVQP---GVLQSGAVQPGMVQP-GILPSGWGQPVAYSLG-LGQPGIGQYGLVQPR--VDRYG 1092
Cdd:pfam09606   59 QQQQPQGGQGNGGMGGGQQGMPdpiNALQNLAGQGTRPQMmGPMGPGPGGPMGQQMGgPGTASNLLASLGRPQmpMGGAG 138

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1093 FVQPGVARGLLQPSDSQRALMQPGVGQVewiQPGMSRRDLVQPGADESGLAQGGMAQQGLVQSGMARQgLAQPGMarqgv 1172
Cdd:pfam09606  139 FPSQMSRVGRMQPGGQAGGMMQPSSGQP---GSGTPNQMGPNGGPGQGQAGGMNGGQQGPMGGQMPPQ-MGVPGM----- 209

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1173 ahPGMArQGVAHPGKARQGVAHPGKARQGVAQPDLAQPGAPSEdkfglaqpivdqsafMQPGMDQRGLVQPRMYQYgfvd 1252
Cdd:pfam09606  210 --PGPA-DAGAQMGQQAQANGGMNPQQMGGAPNQVAMQQQQPQ---------------QQGQQSQLGMGINQMQQM---- 267

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1253 psdlqrnflqprgvlPRLVQPVVDQGGPLQAGLAQSRMVQPITDQRGPVQPETLQPRQVQPSTSRRGLvqslltpyglMQ 1332
Cdd:pfam09606  268 ---------------PQGVGGGAGQGGPGQPMGPPGQQPGAMPNVMSIGDQNNYQQQQTRQQQQQQGG----------NH 322

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1333 PGAAQLGLVQPGmeqlGEERRGLLQPGMDQPGLLQPGtdQPGLLQPGADQPGllqpgadQPGLLQPGADQPGFLQPGADQ 1412
Cdd:pfam09606  323 PAAHQQQMNQSV----GQGGQVVALGGLNHLETWNPG--NFGGLGANPMQRG-------QPGMMSSPSPVPGQQVRQVTP 389

                          410       420       430       440       450       460
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*.
gi 1039736891 1413 PGFLQPGAARLDriqPGMVEPGAGPQGLGQPDLAPPPFIHPGIFPRGIFQPATlPRGFRQPTPTQP 1478
Cdd:pfam09606  390 NQFMRQSPQPSV---PSPQGPGSQPPQSHPGGMIPSPALIPSPSPQMSQQPAQ-QRTIGQDSPGGS 451

YhaN

COG4717

Uncharacterized conserved protein YhaN, contains AAA domain [Function unknown];

1598-2010

3.35e-07

Uncharacterized conserved protein YhaN, contains AAA domain [Function unknown];

Pssm-ID: 443752 [Multi-domain] Cd Length: 641 Bit Score: 55.54 E-value: 3.35e-07

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1598 ETRREQQRQESLppsfpmAVETLRLIGELISLYLELKEQLKDLDEELagqtdfEKIQYLItmivkktipQDLAEQLKSLK 1677
Cdd:COG4717    108 EAELEELREELE------KLEKLLQLLPLYQELEALEAELAELPERL------EELEERL---------EELRELEEELE 166

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1678 TLNKEVRQDKAKLEKIQKFVDSAADTTGGKGVKP-NHLSLQLGILRVTVSDIEKELNELRESQDRGKATMENSVSEASLY 1756
Cdd:COG4717    167 ELEAELAELQEELEELLEQLSLATEEELQDLAEElEELQQRLAELEEELEEAQEELEELEEELEQLENELEAAALEERLK 246

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1757 LQDQLDKLRTIIESMLGSSSTLLSMSITPHKSTA------CLVPGQIDPEATCPACSLDVSHQVSLLVQ-RYEQLQDMVS 1829
Cdd:COG4717    247 EARLLLLIAAALLALLGLGGSLLSLILTIAGVLFlvlgllALLFLLLAREKASLGKEAEELQALPALEElEEEELEELLA 326

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1830 GLAASRPSKKAKLQgQDEELLGHVQSAILQVQGDCEKLNIttsNLIEDHRQ------KQKDIEVLYQGIERLDKEKANRE 1903
Cdd:COG4717    327 ALGLPPDLSPEELL-ELLDRIEELQELLREAEELEEELQL---EELEQEIAallaeaGVEDEEELRAALEQAEEYQELKE 402

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1904 HLEmEIDEKADksALASKVSRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKlLAEMDSKLDRLELDPLKQMLEDRW 1983
Cdd:COG4717    403 ELE-ELEEQLE--ELLGELEELLEALDEEELEEELEELEEELEELEEELEELREE-LAELEAELEQLEEDGELAELLQEL 478

                          410       420
                   ....*....|....*....|....*....
gi 1039736891 1984 KSLRQQLKErpplyQADEAAAMR--RQLL 2010
Cdd:COG4717    479 EELKAELRE-----LAEEWAALKlaLELL 502

PHA03379

EBNA-3A; Provisional

767-1056

1.78e-05

EBNA-3A; Provisional

Pssm-ID: 223066 [Multi-domain] Cd Length: 935 Bit Score: 50.06 E-value: 1.78e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  767 HGILPG-LAQPRGVLPGMVQ---PGAVQPgvLQPGAVQPGVLQPGAVQPG--------VLQPGAAQPGLVQPGAAQPGLV 834
Cdd:PHA03379   449 HDLEPGpLHDQHSMAPCPVAqlpPGPLQD--LEPGDQLPGVVQDGRPACApvpapagpIVRPWEASLSQVPGVAFAPVMP 526

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  835 QPGAAQPGVLQAGAVQPGVLQAgavQPGMVQQGPVQP-GVLQAGAA-QPGMVHPGAAQPgmVQPGSVQPGMVQLGA---- 908
Cdd:PHA03379   527 QPMPVEPVPVPTVALERPVCPA---PPLIAMQGPGETsGIVRVRERwRPAPWTPNPPRS--PSQMSVRDRLARLRAeaqp 601

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  909 ------VQPGVLQAGAVQFGMVQPGAVEPgvlragavQLGMVQPGAVQLGVFRAG---AVQPGVLQAGAVQPgMVQQGPV 979
Cdd:PHA03379   602 yqasveVQPPQLTQVSPQQPMEYPLEPEQ--------QMFPGSPFSQVADVMRAGgvpAMQPQYFDLPLQQP-ISQGAPL 672

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  980 QP------GVLQAGAVQPGMVQQGPVQPgvLQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQSGAVQPGM 1053
Cdd:PHA03379   673 APlrasmgPVPPVPATQPQYFDIPLTEP--INQGASAAHFLPQQPMEGPLVPERWMFQGATLSQSVRPGVAQSQYFDLPL 750


                   ...
gi 1039736891 1054 VQP 1056
Cdd:PHA03379   751 TQP 753

PRK07764

DNA polymerase III subunits gamma and tau; Validated

774-1216

2.79e-05

DNA polymerase III subunits gamma and tau; Validated

Pssm-ID: 236090 [Multi-domain] Cd Length: 824 Bit Score: 49.60 E-value: 2.79e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  774 AQPRGVLPGMVQPGAVQPGVLQPGAVQPGVLQPGAVQPGVLQPGAAQPglVQPGAAQPglvQPGAAQPGVLQAGAVQPGV 853
Cdd:PRK07764   380 RLERRLGVAGGAGAPAAAAPSAAAAAPAAAPAPAAAAPAAAAAPAPAA--APQPAPAP---APAPAPPSPAGNAPAGGAP 454

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  854 LQAGAVQPGMVQQGPVQPGVLQAGAAQPGM--VHPGAAQPGMVQPGSVQPGMVQLGAVQ---PGVLQA-----GAVQFGM 923
Cdd:PRK07764   455 SPPPAAAPSAQPAPAPAAAPEPTAAPAPAPpaAPAPAAAPAAPAAPAAPAGADDAATLRerwPEILAAvpkrsRKTWAIL 534

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  924 VQPGAVEPgvLRAGAVQLGMVQPGAVQLgvFRAGAVQPGVLQAGAVQPGM-----VQQGPvqPGVLQAGAVQPGMVQQGP 998
Cdd:PRK07764   535 LPEATVLG--VRGDTLVLGFSTGGLARR--FASPGNAEVLVTALAEELGGdwqveAVVGP--APGAAGGEGPPAPASSGP 608

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  999 VQPGVLQAGAVQPGmvqqGPVQPGvlQAGAVQPGMVQQGPVQPGVLQSGAVQPGMVQPGILPSGWGQPVAyslGLGQPGI 1078
Cdd:PRK07764   609 PEEAARPAAPAAPA----APAAPA--PAGAAAAPAEASAAPAPGVAAPEHHPKHVAVPDASDGGDGWPAK---AGGAAPA 679

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1079 GQYGLVQPRVDRYGFVQPGvargllqPSDSQRALMQPGVGQveWIQPGMSRRdlvQPGADESGLAQGGMAQQGLvqsgma 1158
Cdd:PRK07764   680 APPPAPAPAAPAAPAGAAP-------AQPAPAPAATPPAGQ--ADDPAAQPP---QAAQGASAPSPAADDPVPL------ 741

                          410       420       430       440       450
                   ....*....|....*....|....*....|....*....|....*....|....*...
gi 1039736891 1159 rqgLAQPGMARQGVAHPGMARQGvAHPGKARQGVAHPGKARQGVAQPDLAQPGAPSED 1216
Cdd:PRK07764   742 ---PPEPDDPPDPAGAPAQPPPP-PAPAPAAAPAAAPPPSPPSEEEEMAEDDAPSMDD 795

PHA03378

EBNA-3B; Provisional

736-1068

4.87e-05

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 48.91 E-value: 4.87e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  736 QPGMDQLgLVQPGTAWSLVQPdVDQLDMAQPHGILPGLAQPrgvlPGMVQPGAVQPGVLQPGAVQPGVLQPGAvQPGVLQ 815
Cdd:PHA03378   557 EPVHDQL-LPAPGLGPLQIQP-LTSPTTSQLASSAPSYAQT----PWPVPHPSQTPEPPTTQSHIPETSAPRQ-WPMPLR 629

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  816 PGAAQPGLVQPGAAQPgLVQPGAAQPGvlqagAVQPGVLQAGAVQPGMVqqgPVQPGVLQAGAAQPGMVHPGAAQP---- 891
Cdd:PHA03378   630 PIPMRPLRMQPITFNV-LVFPTPHQPP-----QVEITPYKPTWTQIGHI---PYQPSPTGANTMLPIQWAPGTMQPppra 700

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  892 -GMVQPGSVQPGMVQLGAVQPGVLQAGAVQFGMVQPGAVEPGVLRAGAVQLGMVQPGAVQLGVFRAGAVQPGV---LQAG 967
Cdd:PHA03378   701 pTPMRPPAAPPGRAQRPAAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGAptpQPPP 780

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  968 AVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAVQ------PGMVQQGPVQPGVLQAGAVQPGMVQQGPVQP 1041
Cdd:PHA03378   781 QAPPAPQQRPRGAPTPQPPPQAGPTSMQLMPRAAPGQQGPTKQilrqllTGGVKRGRPSLKKPAALERQAAAGPTPSPGS 860

                          330       340       350
                   ....*....|....*....|....*....|.
gi 1039736891 1042 G----VLQSGAVQPGMVQPGILPSGWGQPVA 1068
Cdd:PHA03378   861 GtsdkIVQAPVFYPPVLQPIQVMRQLGSVRA 891

PRK03918

DNA double-strand break repair ATPase Rad50;

1625-2010

8.74e-05

DNA double-strand break repair ATPase Rad50;

Pssm-ID: 235175 [Multi-domain] Cd Length: 880 Bit Score: 47.75 E-value: 8.74e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1625 ELISLYLELKEQLKDLDEELAGQTdfEKIQYLItmivkktipqdlaEQLKSLKTLNKEVRQDKAKLEKIQKFVDSaadtt 1704
Cdd:PRK03918   297 KLSEFYEEYLDELREIEKRLSRLE--EEINGIE-------------ERIKELEEKEERLEELKKKLKELEKRLEE----- 356

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1705 ggkgVKPNHLSLQlgilrvTVSDIEKELNELR-----ESQDRGKATMENsVSEASLYLQDQLDKLRTIIESMLGSSSTlL 1779
Cdd:PRK03918   357 ----LEERHELYE------EAKAKKEELERLKkrltgLTPEKLEKELEE-LEKAKEEIEEEISKITARIGELKKEIKE-L 424

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1780 SMSITPHKSTaclvpgqidpEATCPACS--LDVSHQVSLLVQRYEQLQDMVSGLA--ASRPSK----KAKLQG---QDEE 1848
Cdd:PRK03918   425 KKAIEELKKA----------KGKCPVCGreLTEEHRKELLEEYTAELKRIEKELKeiEEKERKlrkeLRELEKvlkKESE 494

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1849 LLGHVQSA--ILQVQGDCEKLNITT--------SNLIEDHRQKQKDIEVLYQGIERLDKEKANREHLEMEIDE-KADKSA 1917
Cdd:PRK03918   495 LIKLKELAeqLKELEEKLKKYNLEElekkaeeyEKLKEKLIKLKGEIKSLKKELEKLEELKKKLAELEKKLDElEEELAE 574

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1918 LASKVSRIQFDaTTEQLNHMMQEL--------VAKMSGQE-QDWQKLLDKLLAEMDSKLDRLELdplkqmLEDRWKSLRQ 1988
Cdd:PRK03918   575 LLKELEELGFE-SVEELEERLKELepfyneylELKDAEKElEREEKELKKLEEELDKAFEELAE------TEKRLEELRK 647

                          410       420
                   ....*....|....*....|..
gi 1039736891 1989 QLKERPPLYQADEAAAMRRQLL 2010
Cdd:PRK03918   648 ELEELEKKYSEEEYEELREEYL 669

SMC_prok_A

TIGR02169

chromosome segregation protein SMC, primarily archaeal type; SMC (structural maintenance of ...

95-237

2.64e-04

Pssm-ID: 274009 [Multi-domain] Cd Length: 1164 Bit Score: 46.21 E-value: 2.64e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891   95 ELENQVKDLGNQVLDLTKQFKTMDNKVQGMATQIDQISVPELQQEEEIALVTQQVSLtkfskiYESEEMMEKPEPTVKMP 174
Cdd:TIGR02169  879 DLESRLGDLKKERDELEAQLRELERKIEELEAQIEKKRKRLSELKAKLEALEEELSE------IEDPKGEDEEIPEEELS 952

                           90       100       110       120       130       140
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*..
gi 1039736891  175 TEMVQLKpsrtpsLTKPTSVLQDLiEDVKiLKQASELQELLQRFNELE----KLVKSREEYLDLLSR 237
Cdd:TIGR02169  953 LEDVQAE------LQRVEEEIRAL-EPVN-MLAIQEYEEVLKRLDELKekraKLEEERKAILERIEE 1011

PHA03247

large tegument protein UL36; Provisional

766-1054

3.18e-04

large tegument protein UL36; Provisional

Pssm-ID: 223021 [Multi-domain] Cd Length: 3151 Bit Score: 46.08 E-value: 3.18e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  766 PHGILPGLAQPRGVLPGMVQPGAVqPGVLQPGAVQPGVLQPGAVQPGVLQPGAAQPGLVQPGAAQPGLVQPGAAQPGVLQ 845
Cdd:PHA03247  2712 PHALVSATPLPPGPAAARQASPAL-PAAPAPPAVPAGPATPGGPARPARPPTTAGPPAPAPPAAPAAGPPRRLTRPAVAS 2790

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  846 AGAVQPGVLQAGAVQPGMVQQGPVQPGVLQAGAAQPGMVHPGAAQPG--MVQPGSVQPGMVQLGAVQPGvlqagavqfgm 923
Cdd:PHA03247  2791 LSESRESLPSPWDPADPPAAVLAPAAALPPAASPAGPLPPPTSAQPTapPPPPGPPPPSLPLGGSVAPG----------- 2859

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  924 vQPGAVEPGVLRAGAVQLGMVQPGAVQLGvfragavQPGVLQAGAVQPgmvqQGPVQPGVLQAGAVQPGMVQQGPVQPGV 1003
Cdd:PHA03247  2860 -GDVRRRPPSRSPAAKPAAPARPPVRRLA-------RPAVSRSTESFA----LPPDQPERPPQPQAPPPPQPQPQPPPPP 2927

                          250       260       270       280       290
                   ....*....|....*....|....*....|....*....|....*....|.
gi 1039736891 1004 LQAGAVQPGMVQQGPVQPGVLQAGAVQPGMVQQGPvqpgvlQSGAVQPGMV 1054
Cdd:PHA03247  2928 QPQPPPPPPPRPQPPLAPTTDPAGAGEPSGAVPQP------WLGALVPGRV 2972

PHA03378

EBNA-3B; Provisional

1051-1363

3.45e-04

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 45.83 E-value: 3.45e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1051 PGMVQPGILPSGWGQPVAYSLgLGQPGIGQYGLVQPRVDRYGFVQPGVARglLQPSDSQRALMQPgvgqVEWiQPGMSRR 1130
Cdd:PHA03378   625 PMPLRPIPMRPLRMQPITFNV-LVFPTPHQPPQVEITPYKPTWTQIGHIP--YQPSPTGANTMLP----IQW-APGTMQP 696

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1131 DLVQPGADESGLAQGGMAQQGLVQSGMARQGLAQPGMARQGVAHPGMARQGVAHPGKARQGVAHPGKARqgvaqPDLAQP 1210
Cdd:PHA03378   697 PPRAPTPMRPPAAPPGRAQRPAAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRAR-----PPAAAP 771

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1211 GAPSEDKFGLAQPIVDQSAFMQPGMDQRGLVQPRMYQygfVDPSDLQRNFLQPRGVLPRLVQPVVDQGGP---LQAGLAQ 1287
Cdd:PHA03378   772 GAPTPQPPPQAPPAPQQRPRGAPTPQPPPQAGPTSMQ---LMPRAAPGQQGPTKQILRQLLTGGVKRGRPslkKPAALER 848

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1288 SRMVQPITDQRGPVQPETLQ-----PRQVQPSTSRRGLvqslltpyGLMQPGAAQlGLVQPGMEQLGEERRGLLQPGMDQ 1362
Cdd:PHA03378   849 QAAAGPTPSPGSGTSDKIVQapvfyPPVLQPIQVMRQL--------GSVRAAAAS-TVTQAPTEYTGERRGVGPMHPTDI 919


                   .
gi 1039736891 1363 P 1363
Cdd:PHA03378   920 P 920

Cast

pfam10174

RIM-binding protein of the cytomatrix active zone; This is a family of proteins that form part ...

1633-1980

3.93e-04

Pssm-ID: 431111 [Multi-domain] Cd Length: 766 Bit Score: 45.58 E-value: 3.93e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1633 LKEQLKDLDEELAG--------QTDFEKIQYLITmivkkTIPQDLAEQLKSLKTLNKEV-RQDKAKLEKIQkfvdsaadt 1703
Cdd:pfam10174  406 LQEQLRDKDKQLAGlkervkslQTDSSNTDTALT-----TLEEALSEKERIIERLKEQReREDRERLEELE--------- 471

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1704 tggkgvkpnhlslqlgilrvtvsDIEKELNELRESQDrgkaTMENSVSEASLYLQDQLDKLRTIIESMLGSSSTLLSMSI 1783
Cdd:pfam10174  472 -----------------------SLKKENKDLKEKVS----ALQPELTEKESSLIDLKEHASSLASSGLKKDSKLKSLEI 524

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1784 TPHKSTAclvpgqidpEATCPACSLDVSHQVSLLVQRYEQLQDMVSGLAASRPSKK---AKLQGQDEELLGhvqsaILQv 1860
Cdd:pfam10174  525 AVEQKKE---------ECSKLENQLKKAHNAEEAVRTNPEINDRIRLLEQEVARYKeesGKAQAEVERLLG-----ILR- 589

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1861 QGDCEKLNittsnliedhrqKQKDIEVLYQGIERLDKEK----ANREHLEMEidEKADKSALASKVSRIQFDATTEQLNH 1936
Cdd:pfam10174  590 EVENEKND------------KDKKIAELESLTLRQMKEQnkkvANIKHGQQE--MKKKGAQLLEEARRREDNLADNSQQL 655

                          330       340       350       360       370
                   ....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1937 MMQELVAKMSG--QEQDWQKL----LDKLLAEMDSKLDRLELDPLKQMLE 1980
Cdd:pfam10174  656 QLEELMGALEKtrQELDATKArlssTQQSLAEKDGHLTNLRAERRKQLEE 705

Mplasa_alph_rch

TIGR04523

helix-rich Mycoplasma protein; Members of this family occur strictly within a subset of ...

78-261

5.03e-04

helix-rich Mycoplasma protein; Members of this family occur strictly within a subset of Mycoplasma species. Members average 750 amino acids in length, including signal peptide. Sequences are predicted (Jpred 3) to be almost entirely alpha-helical. These sequences show strong periodicity (consistent with long alpha helical structures) and low complexity rich in D,E,N,Q, and K. Genes encoding these proteins are often found in tandem. The function is unknown.

Pssm-ID: 275316 [Multi-domain] Cd Length: 745 Bit Score: 45.40 E-value: 5.03e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891   78 TSKEKHQSLPRLSQTPQELENQVKDLGNQVLDLTKQFKTMDNkvqgmatqidQISVPELQQEE-EIALVTQQVSLTKFSK 156
Cdd:TIGR04523  406 LNQQKDEQIKKLQQEKELLEKEIERLKETIIKNNSEIKDLTN----------QDSVKELIIKNlDNTRESLETQLKVLSR 475

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  157 IYESEEmmEKPEPTVKmptemvQLKpSRTPSLTKPTSVLQDLIEDVKILKQasELQELLQRFNELEKLVKSREEYLDLLS 236
Cdd:TIGR04523  476 SINKIK--QNLEQKQK------ELK-SKEKELKKLNEEKKELEEKVKDLTK--KISSLKEKIEKLESEKKEKESKISDLE 544

                          170       180
                   ....*....|....*....|....*
gi 1039736891  237 RRLNllapggEEITMVTWEELEQVI 261
Cdd:TIGR04523  545 DELN------KDDFELKKENLEKEI 563

PAT1

pfam09770

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate ...

774-915

9.66e-04

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate chromosome transmission during cell division.

Pssm-ID: 401645 [Multi-domain] Cd Length: 846 Bit Score: 44.26 E-value: 9.66e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  774 AQPRGVLPGMVQPGAVQPGVLQPGAVQPGVLQPGAVQPGVLQPGAAQPGLVQPGAAQPG--LVQPGAAQPGVLQAGAVQP 851
Cdd:pfam09770  205 AQAKKPAQQPAPAPAQPPAAPPAQQAQQQQQFPPQIQQQQQPQQQPQQPQQHPGQGHPVtiLQRPQSPQPDPAQPSIQPQ 284

                           90       100       110       120       130       140       150
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|.
gi 1039736891  852 GVLQAGAVQPGMVQ-----QGPVQPGVLQAGAAQPGM--VHPGAAQPGMVQPGSvQPGMVQLGAVQPGVLQ 915
Cdd:pfam09770  285 AQQFHQQPPPVPVQptqilQNPNRLSAARVGYPQNPQpgVQPAPAHQAHRQQGS-FGRQAPIITHPQQLAQ 354

PRK03918

DNA double-strand break repair ATPase Rad50;

1617-1767

1.69e-03

DNA double-strand break repair ATPase Rad50;

Pssm-ID: 235175 [Multi-domain] Cd Length: 880 Bit Score: 43.51 E-value: 1.69e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1617 VETLRLIGELISLYLELKEQLKDLDEELAG---------QTDFEKI-QYLITmiVKKTIpQDLAEQLKSLKTLNKEVRQD 1686
Cdd:PRK03918   485 LEKVLKKESELIKLKELAEQLKELEEKLKKynleelekkAEEYEKLkEKLIK--LKGEI-KSLKKELEKLEELKKKLAEL 561

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1687 KAKLEKIQKFVDSAADTTGGKGVKP-NHLSLQLGILR------VTVSDIEKELNELRESQDRgkatMENSVSEASLYLQD 1759
Cdd:PRK03918   562 EKKLDELEEELAELLKELEELGFESvEELEERLKELEpfyneyLELKDAEKELEREEKELKK----LEEELDKAFEELAE 637


                   ....*...
gi 1039736891 1760 QLDKLRTI 1767
Cdd:PRK03918   638 TEKRLEEL 645

DR0291

COG1579

Predicted nucleic acid-binding protein DR0291, contains C4-type Zn-ribbon domain [General ...

1632-1770

2.96e-03

Predicted nucleic acid-binding protein DR0291, contains C4-type Zn-ribbon domain [General function prediction only];

Pssm-ID: 441187 [Multi-domain] Cd Length: 236 Bit Score: 41.45 E-value: 2.96e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1632 ELKEQLKDLDEELAG-QTDFEKIQylitmivkktipQDLAEQLKSLKTLNKEVRQDKAKLEKIQKFVDSAADTtggKGVK 1710
Cdd:COG1579     28 ELPAELAELEDELAAlEARLEAAK------------TELEDLEKEIKRLELEIEEVEARIKKYEEQLGNVRNN---KEYE 92

                           90       100       110       120       130       140
                   ....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1711 pnHLSLQLGILRVTVSDIEKELNELRESQDRGKATMENsvseaslyLQDQLDKLRTIIES 1770
Cdd:COG1579     93 --ALQKEIESLKRRISDLEDEILELMERIEELEEELAE--------LEAELAELEAELEE 142

PHA03379

EBNA-3A; Provisional

807-1251

4.04e-03

EBNA-3A; Provisional

Pssm-ID: 223066 [Multi-domain] Cd Length: 935 Bit Score: 42.35 E-value: 4.04e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  807 GAVQPGVLQPgaaQPGLVQPGAAQPGLVQPGAAQPGVLQAGAVQPgVLQAGAVQPGMVQQGPvqPGVLQAgaaqpgmVHP 886
Cdd:PHA03379   414 GTPRPPVEKP---RPEVPQSLETATSHGSAQVPEPPPVHDLEPGP-LHDQHSMAPCPVAQLP--PGPLQD-------LEP 480

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  887 GAAQPGMVQPGSVQPGMVQLGA------VQPGVLQAGAVQFGMVQPgavepgvlragavqlgmvQPGAVQLGVFRAGAVQ 960
Cdd:PHA03379   481 GDQLPGVVQDGRPACAPVPAPAgpivrpWEASLSQVPGVAFAPVMP------------------QPMPVEPVPVPTVALE 542

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891  961 PGVLQAgavQPGMVQQGPVQP-GVLQAG-AVQPGMVQQGPVQPGVLQAGAVQP--GMVQQGPVQPGVlqagAVQPGMVQQ 1036
Cdd:PHA03379   543 RPVCPA---PPLIAMQGPGETsGIVRVReRWRPAPWTPNPPRSPSQMSVRDRLarLRAEAQPYQASV----EVQPPQLTQ 615

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1037 GPVQPGVlqSGAVQPGMVQPGILPSGWGQPVAYSLGLG--QPGIGQYGLVQPRVDRygfvqpgvargllQPSDSQRALMQ 1114
Cdd:PHA03379   616 VSPQQPM--EYPLEPEQQMFPGSPFSQVADVMRAGGVPamQPQYFDLPLQQPISQG-------------APLAPLRASMG 680

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1115 PgVGQVEWIQPGMSRRDLVQPgadesgLAQGGMAQQGLVQSGMARQgLAQPGMARQGVAHPGMARQGVAHPGKA----RQ 1190
Cdd:PHA03379   681 P-VPPVPATQPQYFDIPLTEP------INQGASAAHFLPQQPMEGP-LVPERWMFQGATLSQSVRPGVAQSQYFdlplTQ 752

                          410       420       430       440       450       460
                   ....*....|....*....|....*....|....*....|....*....|....*....|.
gi 1039736891 1191 GVAHPGKARQGVAQPDLAQPGAPSEDKFglaqpivdQSAFMQPGMDQrglVQPRMYQYGFV 1251
Cdd:PHA03379   753 PINHGAPAAHFLHQPPMEGPWVPEQWMF--------QGAPPSQGTDV---VQHQLDALGYV 802

MAD

pfam05557

Mitotic checkpoint protein; This family consists of several eukaryotic mitotic checkpoint ...

1596-2009

4.68e-03

Mitotic checkpoint protein; This family consists of several eukaryotic mitotic checkpoint (Mitotic arrest deficient or MAD) proteins. The mitotic spindle checkpoint monitors proper attachment of the bipolar spindle to the kinetochores of aligned sister chromatids and causes a cell cycle arrest in prometaphase when failures occur. Multiple components of the mitotic spindle checkpoint have been identified in yeast and higher eukaryotes. In S.cerevisiae, the existence of a Mad1-dependent complex containing Mad2, Mad3, Bub3 and Cdc20 has been demonstrated.

Pssm-ID: 461677 [Multi-domain] Cd Length: 660 Bit Score: 42.04 E-value: 4.68e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1596 VSETRREQQRQESlppsfpmavetlrligELISLYLELKEQLKDLDEELAGQTDFEKIQylitmivkktipQDLAEQLKS 1675
Cdd:pfam05557  113 LSELRRQIQRAEL----------------ELQSTNSELEELQERLDLLKAKASEAEQLR------------QNLEKQQSS 164

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1676 LKTLNKEVRQdkakLE-KIQKFVDSAADTtggKGVKPNHLSlqlgilrvtVSDIEKELNELRESQDRgkatmENSVSEAS 1754
Cdd:pfam05557  165 LAEAEQRIKE----LEfEIQSQEQDSEIV---KNSKSELAR---------IPELEKELERLREHNKH-----LNENIENK 223

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1755 LYLQDQLDKLRTIIESMLGSSSTLLSMSITPHKSTACLVPGQIDPEATC-----PacsLDVSHQVSLLVQRYEQLQDMVS 1829
Cdd:pfam05557  224 LLLKEEVEDLKRKLEREEKYREEAATLELEKEKLEQELQSWVKLAQDTGlnlrsP---EDLSRRIEQLQQREIVLKEENS 300

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1830 GLAAS-RPSKKAKLQGQDEellghvqsaILQVQGDCEKLNI---TTSNLIEdHRQKQ-----KDIEVLYQGIERLDKEKA 1900
Cdd:pfam05557  301 SLTSSaRQLEKARRELEQE---------LAQYLKKIEDLNKklkRHKALVR-RLQRRvllltKERDGYRAILESYDKELT 370

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1901 NREH---LEMEIDEKADksalaskvsriqfdatteqlnhMMQELVAKMSGQEQDwqklLDKLLAEMDSKLDRLeldplkQ 1977
Cdd:pfam05557  371 MSNYspqLLERIEEAED----------------------MTQKMQAHNEEMEAQ----LSVAEEELGGYKQQA------Q 418

                          410       420       430
                   ....*....|....*....|....*....|..
gi 1039736891 1978 MLEDRWKSLRQQLKERPPLYQADEAAAMRRQL 2009
Cdd:pfam05557  419 TLERELQALRQQESLADPSYSKEEVDSLRRKL 450

COG4913

Uncharacterized conserved protein, contains a C-terminal ATPase domain [Function unknown];

1811-1977

6.47e-03

Uncharacterized conserved protein, contains a C-terminal ATPase domain [Function unknown];

Pssm-ID: 443941 [Multi-domain] Cd Length: 1089 Bit Score: 41.82 E-value: 6.47e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1811 SHQVSLLVQRYEQLQDMVSGLAASRPSKKAKLQGQDEELLGhVQSAILQVQGDceklnittsnliedhrqkqkDIEVLYQ 1890
Cdd:COG4913    287 QRRLELLEAELEELRAELARLEAELERLEARLDALREELDE-LEAQIRGNGGD--------------------RLEQLER 345

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1891 GIERLDKEKANREHLEMEIDEKADKSALASKVSRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKlLAEMDSKLDRL 1970
Cdd:COG4913    346 EIERLERELEERERRRARLEALLAALGLPLPASAEEFAALRAEAAALLEALEEELEALEEALAEAEAA-LRDLRRELREL 424


                   ....*....
gi 1039736891 1971 --ELDPLKQ 1977
Cdd:COG4913    425 eaEIASLER 433

DR0291

COG1579

Predicted nucleic acid-binding protein DR0291, contains C4-type Zn-ribbon domain [General ...

1809-1993

6.96e-03

Predicted nucleic acid-binding protein DR0291, contains C4-type Zn-ribbon domain [General function prediction only];

Pssm-ID: 441187 [Multi-domain] Cd Length: 236 Bit Score: 40.29 E-value: 6.96e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1809 DVSHQVSLLvqryeQLQDMVSGLAASRpSKKAKLQGQDEELlghvQSAILQVQGDCEKLNITTSNLIEDHRQKQKDIEVL 1888
Cdd:COG1579      2 MPEDLRALL-----DLQELDSELDRLE-HRLKELPAELAEL----EDELAALEARLEAAKTELEDLEKEIKRLELEIEEV 71

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1889 YQGIERLDKE----KANRE--HLEMEIDE-KADKSALASKVSRI--QFDATTEQLNHMmQELVAKMSGQEQDWQKLLDKL 1959
Cdd:COG1579     72 EARIKKYEEQlgnvRNNKEyeALQKEIESlKRRISDLEDEILELmeRIEELEEELAEL-EAELAELEAELEEKKAELDEE 150

                          170       180       190
                   ....*....|....*....|....*....|....*.
gi 1039736891 1960 LAEMDSKLDRL--ELDPLKQMLEDRWKSLRQQLKER 1993
Cdd:COG1579    151 LAELEAELEELeaEREELAAKIPPELLALYERIRKR 186

ClyA_XaxA-like

cd22657

Xenorhabdus nematophila alpha-xenorhabdolysin (XaxA) and Yersinia enterocolitica YaxA, and ...

1617-1780

7.96e-03

Pssm-ID: 439155 [Multi-domain] Cd Length: 306 Bit Score: 40.65 E-value: 7.96e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1617 VETLRLIGELISLYL----ELKEQLKDLDEELAGQTDFEkIQYLITMIVKKTIPQDLAEQLKSLKTLNKEVRQdkaKLEK 1692
Cdd:cd22657     94 GEYLEDIKEDIKEYSksteEVKARLDDFRDELREELIPE-VKLKLKLIDRNDLDEEIEELNEEIDELDEEIDE---LNKE 169

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1039736891 1693 IQKFVDSAAdtTGGKGVkPNHLSLQLGILRVTVSDIEKELNELRESQDR------GKATMENSVSEASLYLQD------- 1759
Cdd:cd22657    170 YKKLVGLAF--TGLAGG-PIGLLITGGIFGVKAEKIRKERNELIAEREEliqklkSKNRLLGSLERLETDLQDldirmid 246

                          170       180
                   ....*....|....*....|....*..
gi 1039736891 1760 ------QLDKLRTIIESMLGSSSTLLS 1780
Cdd:cd22657    247 aevatkNLETVWNTILTYIDASAEELD 273

Blast search parameters

Data Source:	Precalculated data, version = cdd.v.3.21
Preset Options:	Database: CDSEARCH/cdd Low complexity filter: no Composition Based Adjustment: yes E-value threshold: 0.01